1.特征相关
1.1 样本
无论是进行数据分析还是模型训练,都需要数据集,这一般被称为样本。以德国信用卡数据为例,其提供了20个属性共1000个实例,最后一列表示类别,这种数据集在风控算法中作为模型训练的样本使用。
1.2 特征
还是以德国信用卡数据集为例,这一样本包含了20个信贷相关属性,包括13个类别属性和7个数值型属性,这20个属性一般会被称为特征。
从中取部分特征说明如下:
分类 | 属性名称 | 取值范围 | 列名 |
---|---|---|---|
基本信息数据 | 年龄 | age | |
基本信息数据 | 房产状态 | A151 : 租房 A152 : 自己的 A153:免租房 |
housing |
信用数据 | 现有支票账户的状态 | A11 : … < 0 A12:0 <= … < 200 A13 : … >= 200 A14 : 没有支票账户 |
account_status |
信用数据 | 财产状况 | A121:房地产 A122:建房协会储蓄协议/人寿保险 A123:汽车或其他 A124:未知/无属性 |
property |
1.3 标签
标签也属于样本的一部分,这是我们用来训练和预测的结果。以德国信用卡数据集为例,标签表示用户的真实逾期情况,1表示good,2表示bad。
2.账龄
账龄在信贷行业中,指的是多期的贷款从放款开始经历的时间段,英文Month on Book,简写是MOB
- MOB0:放款日至当月月底,观察时间点为放款当月月末
- MOB1:放款后第二个月,观察时间点为第二个月月末
- MOB2:放款后第三个月,观察时间点为第三个月月末
MOB的最大值取决于信贷产品期限,如果是12期产品,那么该资产的生命周期是12期,MOB最大到MOB12
3.逾期
逾期的概念包括以下几种:
- 逾期天数(Days Past Due,DPD):
- 实际还款日与应还款日的相差天数
- 例如,每月1日为还款日,那么10日为逾期9天,11日为逾期10天。若客户在15日还款, 则逾期天数为14,记为DPD14
- 首期逾期天数(First Payment Deliquency,FPD):
- 分期产品中第一期实际还款日与 应还款日的相差天数
- 例如,2024年5月1日放款的订单,共12期,第一期还款时间为6月1日,若实际还款时间为6月2日,则首期逾期天数为1,记为FPD1
- 逾期期数:贷款产品中客户的逾期期数,也指将逾期天数按区间划分后的逾期状态。 通常以 30 天为区间划分,用英文字母M表示
- ♦ M0:当前未逾期
- ♦ M1:逾期1期,或逾期1~30日
- ♦ M2:逾期2期,或逾期31~60日
- ♦ M3:逾期3期,或逾期61~90日
- 依此类推,M3+表示逾期3期以上,或逾期天数为91天及以上,和DPD90+含义 一致
- 逾期率:分为订单逾期率和金额逾期率。订单逾期率是指逾期订单数与总放款订单数 的比值
- M1逾期率表示逾期1期的订单数与总订单数的比值,DPD30+逾期率表示逾期 30天以上的订单数与总订单数的比值
- 金额逾期率是指逾期金额与总放款金额的比值