某分行联合贷产品建模结果(未完成)

某分模型评估

1.iv值大于2直接作为规则。其中看一下覆盖率、坏客户率。坏客户率达到60%以上就作为直拒规则。看一下每个区间中,累计的样本占比,累计的坏账率。如果满足低命中率(样本占比),高准确率(一般坏样本率60%)就把它作为规则放到风控中。

2.等频分箱,计算woe值,iv值,iv值大于2小于0.01的删掉。(分箱有很多种)。woe的排序和值,woe的单调性。

3.缺失值大于80%的变量删掉。

先过模型,后又过的规则(iv值规则)。

4.逻辑回归p值要显著,否则删掉,相关性,vif值。

0.44

0.79

最终评分20等分分组,合并之后分了。

最终lr模型6个变量。

5.对业务风险判断的指标:审核通过率,坏客户召回率,通过用户的坏账率。

6.贷中监控。前三个月稳定性按周来看,后面可以按月来做。ks监控。对变量的psi和ks监控。当突破阈值后就要更新。监控逾期情况。试运行结束后要上一个报告。

7.授信额度通过率、信用风险通过率。

问题:

1.模型在测试集和训练集的分数分布是否一致?中心一致吗?形状差距有多大?如何考虑的?为什么?

2.为什么取逾期30天为y?有什么理论依据?

3.信息校验和黑名单拒绝的命中率有多少?后面建模时把这些样本也放进去了吗?

4.这次建模数据是阿波罗数据?然后又在阿波罗数据上进行的汇总分箱?

5.采样这块,数据不均衡怎么处理的?

6.没有跨时间验证。

7.没有用户申请时间。为什么没有?这个信息很敏感吗?

8.申请时间、放款时间、逾期时间。

9.变量分箱这块,全都用等频分箱?这样划分的每个区间还有业务意义吗?为什么没有考虑和y的关系分箱?比如卡方分箱?

10.消费等级评分的计算逻辑?是否是稳定的?

大数据部:

数据、变量处理。

一开始22个变量,之后iv删掉11个,又把lr变量显著性不显著的5个变量删掉,最后有6个变量进入最终模型。

反欺诈策略分析:

欺诈率,坏客户率。

信息科技部:模型开发团队、模型部署团队。

系统改造(包括和总行系统对接,模型参数修改等)。

1.对接外部数据。

2.模型部署,信息科技部给个人部开账号。

猜你喜欢

转载自www.cnblogs.com/ironan-liu/p/11826791.html
今日推荐