炼数成金 门户 量化投资 查看内容

金融风控干货篇:失联模型

2019-7-22 15:48| 发布者: 炼数成金_小数| 查看: 18040| 评论: 0|来自: 信数金服

摘要: 失联对催收会产生非常大的阻碍,尽早了解客户是否失联对催收有很重要的意义。失联模型是基于历史数据,预测客户发生失联的可能性,希望将失联由事后发生编程提前预知。但是失联模型的开发对于机构是一项重大的挑战, ...

网络 模型 金融 量化投资 金融风控

失联对催收会产生非常大的阻碍,尽早了解客户是否失联对催收有很重要的意义。

简单来说,开发一张失联评分卡的目的有:
一是为了提前委外

二是为了信息修复

但是难点是:
客户是否失联的信息通常来源于催收结果,但准确定义失联客户是一个难题。

因为:单次催收联系上客户通常不能判断客户是否失联,比如客户手机信号弱而没有接听,导致催收人员跟客户联系不上的情况经常发生。

故对于是否失联需要综合一定的时间的催收结果进行判断,若该段时间内催收人员拨打多次电话,且在一天之内的不同时段反复拨打电话,均无法联系客户,才能判断为失联。

失联模型是基于历史数据,预测客户发生失联的可能性,希望将失联由事后发生编程提前预知。

但是失联模型的开发对于机构是一项重大的挑战,失联模型的预测变量变量通常需要结合金融机构内部的客户信息、交易信息催收信息、营销信息等,同时结合第三方信息来提供模型的预测能力,主要关注客户以下信息:
交易情况
贷款余额情况
额度占有情况
最近一次联系客户的情况
户籍信息
工作家庭情况
历史催收情况

一般的书籍介绍到这里就ending了……..前面讲了一大堆套话,水份太多了,如果只到这里大家是不是都要转身离开,有爱说不出来啊下面我们直接来挤水分吧..........

一、目前一般的公司里对失联的定义

二、真正开发好能进入失联评分卡的变量

失联的种类 
失联的定义跟一个公司的对客户的定义相关,你家大概允许客户在多长的时间窗口内失联。

一般公司会根据失联的情况,把失联种类称为失联完全失联,1-7天失联, TPC失联….

解释下这几个名词:
完全失联指的是客户完全联系不上

1-7天失联也就是客户在dayl-day7天内联系不上

TPC失联指的是拨打客户有关系第三方的联系人也联系不上

当然你可以根据公司具体的业务需求开发相关的失联时间窗口变量,思路已经提给给各位。

当然对应于实际的业务场景以下都是造成我们无法跟客户联系上具体场景:
无法接通
停机空号
拒绝关机
...等

下面再来上一个例子,比如一个公司是需要开发一个客户完全失联的评分卡模型,完全失联就是跟客户怎么样也联系不上。比如那我们跟客户联系了100个号码,前面99个都联系不上客户,只有最后一个才联系上了客户,对不起这样的场景还不能算完全失联。这个样本也就不能采纳了。

 失联变量 
介绍失联变量前,可先具体到一个具体的失联评分卡的开发案例。

具体的业务场景:
我们以一个线下消费贷的场景为例具体说明下,当一个客户处于dpd10天时候(思考为什么是预测dpd10天后的失联情况?因为客户经过前面9天的催收,已经有了9天的催收数据,相对会准一些),我们再预测未来5天后是否失联,也即预测客户在dpd16天是否会失联的概率。以下是敲黑板,划重点的时刻:
(有些变量在贷前的评分卡里,完全没想到)

是否BP
这个变量输出的是---客户承诺还款但是实际没有还的情况,这个比较好理解,无论在哪种催收卡评分卡里都是区分能力不错的变量。该变量只要1跟0两个取值

当前与上次联络时间差
这个变量入模,解释下很强,能联系上的时间越短,显然越不容易失联

委外标识
客群是否有提前被委外催收的情况,这个可在公司对应的其他产品里能关联上
与客户上次进入失联的时间差
rt,距离上次失联的情况怎样

年龄
没想到这个变量也能入模吧,年龄的变量也是有一定的区分能力,贷款的年龄

较大的贷款期数
这个变量获取比较容易,主要是客户的贷款时长

联系人RPC数量
有效联系人(一般指客户本人、父母、配偶、直系亲属)的数量
RPC是否有父亲,是否有母亲,是否有配偶

有效联系人里是否有直系亲属这些信息,可见在患难时刻都是亲人能站出来啊

客户填写移动的电话量
注意这里是移动电话而不是固话,因为在我这个数据里的表现来看,固话一般都比较容易掺杂着不太准确的电话,客户也比较从网络获取这些信息。

有同学会问,这个变量怎么能在线上的产品获取到吗?大家请注意,我们的命题已经假设了这个是一个线下消费贷的产品,填写的资料比线上的产品维度会丰富一些

近一天本人电话催收次数
这个催收人员跟客户联系的次数,证明客户被催的越多,接下来越可能消失

居住城市与银行卡城市是否一致
这个变量是个说透了也比较好理解的变量
...
...

最后分析下客户失联的原因是多种多样的,如提供虚假材料才得以贷款,因抵触催收故意不接电话、信息更新不及时等都可能造成客户失联,失联原因的复杂性和多样性给模型带来了很大困难。在此,建议信贷机构要求客户多填写相关信息,审核部门在贷前核实信息的真实有效性,以免日后催收时带来各种困难。

声明:本文版权归原作者所有,文章收集于网络,为传播信息而发,如有侵权,请联系小编及时处理,谢谢!

欢迎加入本站公开兴趣群
量化投资群
兴趣范围包括:量化投资,算法交易,金融建模,统计套利等等
QQ群 697033743
如果大家不明白什么是量化投资,在百度谷歌搜索一下“西蒙斯”就知道了,最近这哥们火极了!这套东西在国外的金融机构已经大量使用,随着中国金融市场规模日益扩大和趋于成熟,这套玩法最终肯定也能在国内转起来,我们一起学习切磋,寻求项目机会做一下,提升自己在这方面的技能,将来一起发财

鲜花

握手

雷人

路过

鸡蛋

相关阅读

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2019-8-19 08:19 , Processed in 0.230509 second(s), 25 queries .