三分钟看懂大数据风控中用户行为数据的采集、分析及应用( 转 )

据统计,目前银行传统的风控模型对市场上70%的客户是有效的,

但是对另外30%的用户,其风控模型有效性将大打折扣。

大数据风控作为传统风控方式补充,主要利用行为数据来实施风险控制,

用户行为数据可以作为另外的30%客户风控的有效补充。


那么,大数据风控运营中,会主要分析用户的哪些行为数据,怎么分析?


1.行为数据的采集和分析

用户行为数据:主要包含用户在网站和移动App中的浏览/点击/发帖等行为,行为数据其实有很大的商业价值,

只是很多企业不知懂如何进行应用。

用户行为数据采集基本上采用SDK方式,采集用户在页面的点击行为,同时也可进行参数回传。

SDK就是几行轻量级代码,采集数据的类型取决于埋点。SDK在数据采集上没有技术壁垒,

行为数据应用的主要技术壁垒在于海量行为数据的处理和分析。

(1)SDK采集数据的私密性?

很多企业总认为SDK采集数据会涉及个人隐私,这主要还是不了解SDK数据采集的技术原理。

SDK,Software Development Kit,直译过来就是软件开发包,用N行软件代码采集数据。

SDK采集的任何数据都来自用户的主观行为,企业在正常商业活动中获取的个人隐私数据并不违反法规,

在没有得到用户授权的情况下,个人隐私数据被企业和第三方使用才是违法行为。

(2)数据处理与分析,有多难?


用户行为数据的处理和分析具有较高的技术门槛:


SDK会采集到大量的“脏数据”,包含一些空白区域和特殊符号,甚至根本没有见过的数据类型,

这些脏数据的处理和分析具有较大的技术挑战,特别是数据的实时采集和处理。

通常技术人员只有经历了海量数据采集和处理,填平了大量“技术坑”之后,才能形成成熟的技术架构。

数据的采集和处理是个脏活累活,需要在真实数据环境进行实战,具有较高的技术壁垒和门槛。


2.个人信用评分

风控最好的数据还是金融数据,例如年龄、收入、职业、学历、资产、负债等信用数据,

这些数据同信用相关度高,可以反映用户的还款能力和还款意愿。 但是除了这些强相关的数据,

一些用户行为数据对信用风险评估也具有较大的影响,

在某些条件下这些因素会成为决定信用风险事件的强相关数据。

过去这些用户行为数据,并没有放到信用风险评估模型中,没有参与客户的信用风险评估。

金融企业和互联网金融企业在分析已经发生的信用风险事件之后,

发现的这些用户行为信息在很多风险事件中起到了很关键的作用。

小概率风险事件会导致很严重的后果,同信用风险事件的发生具有较强的关联性。

用户行为数据可以作用于互金的各个环节。虽然这个数据你看着跟金融业务没有那么相关,

但是物以类聚、人以群分这个事是没有错的,这些人的行为确实是有一定规律的,

所以如果我们有一些标识的数据通过对他的行为相近性进行判断,效果还是不错的。


 

第一方面:完善客户画像


客户画像就是对用户打标签,以表示不同属性的用户。例如打上性别标签、年龄标签、消费偏好标签。

这点在电商行业已被广泛运用。

客户画像的原理是,通过样本数据学习不同标签用户的行为特征,

再根据学习到的知识来将未知标签的用户进行分类。

 客户画像的应用面非常广泛。在互联网金融的风险控制上可用于征信评级,

反欺诈风险控制以及动态调整级别和监控(增收和降低坏账率)、快速放贷和提升金融服务水平。

客户画像包括人口统计学特征、消费能力数据、兴趣数据、风险偏好等;

企业客户画像包括企业的生产、流通、运营、财务、销售和客户数据、相关产业链上下游等数据。

值得注意的是,金融机构拥有的客户信息并不全面,基于平台自身拥有的数据有时候难以得出理想的结果甚至可能得出错误的结论。

所以金融机构不仅仅要考虑自身业务所采集到的数据,更应考虑整合更多的行为数据,

以扩展对客户的了解。包括:客户在社交媒体上的行为数据(如光大银行建立了社交网络信息数据库)。

通过打通银行内部数据和外部社会化的数据可以获得更为完整的客户拼图,从而进行更为精准的营销和管理;

客户在电商网站的交易数据,如建设银行则将自己的电子商务平台和信贷业务结合起来,

阿里金融为阿里巴巴用户提供无抵押贷款,用户只需要凭借过去的信用即可;

企业客户的产业链上下游数据。如果银行掌握了企业所在的产业链上下游的数据,

可以更好掌握企业的外部环境发展情况,从而可以预测企业未来的状况;

其他有利于扩展银行对客户兴趣爱好的数据,如网络广告界目前正在兴起的DMP数据平台的互联网用户行为数据。

第二方面:欺诈行为分析

风险管理的核心应用在反欺诈上,金融行业的反欺诈验证。

第一点:可以通过分析用户的社保数据、运营商数据、网络行为数据(职业、收入等预测画像…)来进行规避。

第二点和第三点:实时分析数据进而监测潜在风险并预警,实时监控系统内的各类数据。

例如:用户操作、交易流水、访问记录等如某内部工作人员在某段时间内操作存贷/汇交易的时间大幅度快于其历史水平;

比银行平均水平也要快出很多;内部员工每个月由其自己账户向几家银行汇款或支付好几家信用卡;

美国这2-3年留学生临到毕业之前的2-3个月,信用卡消费是历史平均的好几倍甚至更多

(如果能结合网络行为信息:查询来源国工作,航旅公司机票那确定性…)美国留学生这个是个很经典的案例。

简言之,通过对用户行为数据的采集和分析,找出欺诈者留下的蛛丝马迹,从而预防欺诈行为的发生。

其现实意义在于提升坏人的欺诈成本,在欺诈行为发生之前就将其制止,进而净化诚信体系。


猜你喜欢

转载自blog.csdn.net/liu123641191/article/details/80441756
今日推荐