金融风控训练营Task01学习笔记

一 ·  知识点概要

  1. 比赛目标
  2. 比赛数据
    1. 训练集
    2. 测试集A、B
  3. 预测指标
    1. 混淆矩阵
    2. 准确率
    3. 精确率
    4. 召回率
    5. F1 Score
    6. P-R曲线
    7. ROC
      1. TPR
      2. FPR
    8. AUC
      1. KS统计量
      2. ROC
      3. AUC
  4. 赛题流程
  5. 代码示例
    1. 数据读取pandas
    2. 分类指标评价计算示例
  6. 经验总结
  7. 拓展知识——评分卡        

二·  学习内容

  1. 比赛目标    根据提供的贷款申请人的数据信息预测其是否有违约,判断是否通过此贷款,对申请人分类并发放贷款。通过建立模型,使用训练集训练模型,使用测试集测试模型,根据测试结果,对模型性能进行评价。
  2. 比赛数据    总数据超过120w,包含47列变量信息,其中15列为匿名变量。脱敏:对敏感信息进行屏蔽。
  3. 3.e F1 Store    精确度和召回率相互影响,同时兼顾精确率和召回率。
  4. 3.h.i KS统计量   K-S曲线将真正例率和假正例率都作为纵轴,横轴则由选定的阈值来充当。KS不同代表的不同情况,一般情况KS值越大,模型的区分能力越强。若KS过大,模型可能存在异常。

三·  问题与解答

      暂无

四·  思考与总结

      通过本次学习,我了解到了有关个人贷款所需的相关信息,知道了怎么对数据模型进行合理的评价。同时,我还对比赛的题目和要求有了深刻的认识,并对比赛充满了期待。

猜你喜欢

转载自blog.csdn.net/weixin_43695233/article/details/115979853