Datawhale 金融风控-贷款违约预测: 赛题理解

比赛地址: https://tianchi.aliyun.com/competition/entrance/531830/introduction

1. 赛题概述

赛题以预测金融风险为任务。该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同对一些特征进行了脱敏处理。

比赛目标为比赛要求参赛选手根据给定的数据集,建立模型,预测金融风险。

2.赛题数据

主要是对特征的描述,如下图所示:

3.评测指标、

提交结果为每个测试样本是1的概率,也就是y为1的概率。以AUC作为评测指标。

猜你喜欢

转载自blog.csdn.net/space_dandy/article/details/108595824