一 · 知识点概要
- 比赛目标
- 比赛数据
- 训练集
- 测试集A、B
- 预测指标
- 混淆矩阵
- 准确率
- 精确率
- 召回率
- F1 Score
- P-R曲线
- ROC
- TPR
- FPR
- AUC
- KS统计量
- ROC
- AUC
- 赛题流程
- 代码示例
- 数据读取pandas
- 分类指标评价计算示例
- 经验总结
- 拓展知识——评分卡
二· 学习内容
- 比赛目标 根据提供的贷款申请人的数据信息预测其是否有违约,判断是否通过此贷款,对申请人分类并发放贷款。通过建立模型,使用训练集训练模型,使用测试集测试模型,根据测试结果,对模型性能进行评价。
- 比赛数据 总数据超过120w,包含47列变量信息,其中15列为匿名变量。脱敏:对敏感信息进行屏蔽。
- 3.e F1 Store 精确度和召回率相互影响,同时兼顾精确率和召回率。
- 3.h.i KS统计量 K-S曲线将真正例率和假正例率都作为纵轴,横轴则由选定的阈值来充当。KS不同代表的不同情况,一般情况KS值越大,模型的区分能力越强。若KS过大,模型可能存在异常。
三· 问题与解答
暂无
四· 思考与总结
通过本次学习,我了解到了有关个人贷款所需的相关信息,知道了怎么对数据模型进行合理的评价。同时,我还对比赛的题目和要求有了深刻的认识,并对比赛充满了期待。