ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例

目录

基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例

# 1、定义数据集

# 2、数据预处理

# 2.1、类别特征编码

# 2.2、特征筛选且空值填充

# 3、模型训练与推理

# 3.1、数据集切分

# 3.2、模型训练

# 4、PDP实现模型可解释性

4.1、Sex_encoding可视化

# (1)、绘制不同特征值(特征网格)的平均目标值:检查特征和目标之间的信息

# (2)、绘制跨不同特征值(特征网格)的模型预测分布

# (3)、计算并绘制PDP图解释模型预测

4.2、Pclass可视化


相关文章
ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例
ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例实现

基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例

# 1、定义数据集

PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked
1 0 3 Braund, Mr. Owen Harris male 22 1 0 A/5 21171 7.25 S
2 1 1 Cumings, Mrs. John Bradley (Florence Briggs Thayer) female 38 1 0 PC 17599 71.2833 C85 C
3 1 3 Heikkinen, Miss. Laina female 26 0 0 STON/O2. 3101282 7.925 S
4 1 1 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35 1 0 113803 53.1 C123 S
5 0 3 Allen, Mr. William Henry male 35 0 0 373450 8.05 S

# 2、数据预处理

# 2.1、类别特征编码

# 2.2、特征筛选且空值填充

   Pclass   Age  SibSp  Parch     Fare  Sex_encoding  Embarked_encoding  \
0       3  22.0      1      0   7.2500             1                  0   
1       1  38.0      1      0  71.2833             0                  1   
2       3  26.0      0      0   7.9250             0                  0   
3       1  35.0      1      0  53.1000             0                  0   
4       3  35.0      0      0   8.0500             1                  0   

   Survived  
0         0  
1         1  
2         1  
3         1  
4         0  

# 3、模型训练与推理

# 3.1、数据集切分

# 3.2、模型训练

# 4、PDP实现模型可解释性

4.1、Sex_encoding可视化

# (1)、绘制不同特征值(特征网格)的平均目标值:检查特征和目标之间的信息

# (2)、绘制跨不同特征值(特征网格)的模型预测分布

# (3)、计算并绘制PDP图解释模型预测

4.2、Pclass可视化

 

猜你喜欢

转载自blog.csdn.net/qq_41185868/article/details/126128039