机器学习 scikit-learn1 预测贷款用户是否会逾期

简介

12个人的小组练习任务 - 提升算法实践能力.

【数据】数据是金融数据, 我们要做的是预测贷款用户是否会逾期. 表格中, status是标签: 0表示未逾期, 1表示逾期.

【学习过程】: 构建模型 - 模型融合 - 模型评估 - 交叉验证 - 模型调参 - 特征工程

【遵循】一次只做一件事, 先实现再优化

【期望目标】掌握数据挖掘的流程, 提升合作的能力.

代码说明

代码目录 https://github.com/spareribs/kaggleSpareribs/tree/master/Overdue

代码目录结构

Overdue
├─dl: 深度学习 TODO
├─ml: 机器学习
│  ├─code
│  │  ├─ sklearn_config.py: 模型配置文件
│  |  ├─ sklearn_gcv.py: 模型配置 网络搜索
│  |  └─ sklearn_train.py: 模型训练
│  ├─data: 数据存放的目录
│  ├─features: 
│  |  └─ base.py: 数据预处理
│  └─for beginner: TODO
└─config.py: 全局配置

代码使用方法

  1. 【必须】config.py 设置文件存放的路径
  2. 【必须】先执行 features 中的 base.py 先把数据处理好 [PS:需要根据实际情况修改]
  3. 【可选】再通过 code 中的 sklearn_gcv.py 搜索模型的最佳配置
  4. 【必须】最后通过 code 中的 sklearn_train.py 训练模型输出结果

个人总结

参考文档

任务1. 逻辑回归模型实践【2018.11.14 - 2018.11.15】

爖:https://github.com/LongJH/ALittleTarget/blob/master/Mission1/mission1-lr.ipynb
Ash:https://blog.csdn.net/truffle528/article/details/84072452
憨宝宝:https://blog.csdn.net/qq_41205464/article/details/84111934
黑桃,等到的过去:https://blog.csdn.net/lgy54321/article/details/84101357
排骨 https://blog.csdn.net/q370835062/article/details/84173260
面朝大海 https://blog.csdn.net/zhangyunpeng0922/article/details/84106715
大范先生,月光疾风:https://blog.csdn.net/weixin_40671804/article/details/84111029
jepson:https://github.com/JepsonWong/Algorithm_Competition/blob/master/客户逾期分析/test.ipynb
李碧涵:https://blog.csdn.net/a786150017/article/details/84138846

任务2.支持向量机和决策树模型实践 【2018.11.15 - 2018.11.16】

爖:https://github.com/LongJH/ALittleTarget/blob/master/Mission1/mission2-svm-dt.ipynb
憨宝宝:https://blog.csdn.net/qq_41205464/article/details/84169197
Ash:https://blog.csdn.net/truffle528/article/details/84168200
黑桃:https://blog.csdn.net/Heitao5200/article/details/84141345
等到的过去:https://blog.csdn.net/lgy54321/article/details/84145213
面朝大海:https://blog.csdn.net/zhangyunpeng0922/article/details/84136003
排骨:https://blog.csdn.net/q370835062/article/details/84311268
大范先生:https://blog.csdn.net/weixin_40671804/article/details/84144980
月光疾风:https://yezuolin.com/2018/11/UserLoanOverdue/
jepson:https://github.com/JepsonWong/Algorithm_Competition/blob/master/客户逾期分析/test.ipynb
李碧涵:https://blog.csdn.net/a786150017/article/details/84138846

任务3.构建xgboost和lightgbm模型进行预测【2018.11.16 - 2018.11.18】

爖:https://github.com/LongJH/ALittleTarget/blob/master/Mission1/mission3-xgboost-lightgbm.ipynb
憨宝宝:https://blog.csdn.net/qq_41205464/article/details/84204927
Ash:https://blog.csdn.net/truffle528/article/details/84200976
黑桃:https://blog.csdn.net/Heitao5200/article/details/84196023
等到的过去:https://blog.csdn.net/lgy54321/article/details/84202770
面朝大海:https://blog.csdn.net/zhangyunpeng0922/article/details/84193403
排骨:https://blog.csdn.net/q370835062/article/details/84436395
大范先生:https://blog.csdn.net/weixin_40671804/article/details/84186625
月光疾风:https://yezuolin.com/2018/11/UserLoanOverdue_XGBoost&LightGBM/
jepson:https://github.com/JepsonWong/Algorithm_Competition/blob/master/客户逾期分析/test.ipynb
李碧涵:https://blog.csdn.net/a786150017/article/details/84138846

任务4.模型评分【2018.11.19 - 2018.11.20】

  • 记录五个模型关于precision,rescore,f1,auc,roc的评分表格,画出auc和roc曲线图

爖:https://blog.csdn.net/l75326747/article/details/84233247
https://github.com/LongJH/ALittleTarget/blob/master/Mission1/mission4-metrics.ipynb
憨宝宝:https://blog.csdn.net/qq_41205464/article/details/84311363
Ash:https://blog.csdn.net/truffle528/article/details/84310726
黑桃:https://blog.csdn.net/Heitao5200/article/details/84299290
等到的过去:https://blog.csdn.net/lgy54321/article/details/84309512
面朝大海:https://blog.csdn.net/zhangyunpeng0922/article/details/84257426
排骨:https://blog.csdn.net/q370835062/article/details/84436428
大范先生:https://blog.csdn.net/weixin_40671804/article/details/84305384
月光疾风:https://yezuolin.com/2018/11/TheModelofUserLoanOverdueEvaluation/
jepson:https://github.com/JepsonWong/Algorithm_Competition/blob/master/客户逾期分析/test.ipynb
李碧涵:https://blog.csdn.net/a786150017/article/details/84138846

任务5. 特征工程 - 数据预处理【2018.11.20 - 2018.11.21】

  • 关于数据类型转换以及缺失值处理(尝试不同的填充看效果)以及你能借鉴的数据探索

爖:https://blog.csdn.net/l75326747/article/details/84326897
憨宝宝 https://blog.csdn.net/qq_41205464/article/details/84348766
Ash:https://blog.csdn.net/truffle528/article/details/84337769
黑桃:https://blog.csdn.net/Heitao5200/article/details/84322187
等到的过去:https://blog.csdn.net/lgy54321/article/details/84330070
面朝大海:https://blog.csdn.net/zhangyunpeng0922/article/details/84346663
排骨:https://blog.csdn.net/q370835062/article/details/84436445
大范先生:https://blog.csdn.net/weixin_40671804/article/details/84346853
月光疾风:https://yezuolin.com/2018/11/UserLoanOverdue_FeatureEngineering/
jepson:https://github.com/JepsonWong/Algorithm_Competition/blob/master/客户逾期分析/test.ipynb
李碧涵:https://blog.csdn.net/a786150017/article/details/84348205

猜你喜欢

转载自blog.csdn.net/q370835062/article/details/84133789