Python-intro机器学习-笔记-20201109-HK - 代码天地

Python-intro机器学习-笔记-20201109-HK

其他 2021-01-22 12:49:45 阅读次数: 0

机器学习入门笔记整理

决策树回归器：
设置Max_leaf_nodes，防止过拟合；

def get_mae(max_leaf_nodes, train_X, val_X, train_y, val_y):
    model = DecisionTreeRegressor(max_leaf_nodes=max_leaf_nodes, random_state=0)

对比多个Max_leaf_nodes参数，找到MAE最优的那个：

# compare MAE with differing values of max_leaf_nodes
for max_leaf_nodes in [5, 50, 500, 5000]:
    my_mae = get_mae(max_leaf_nodes, train_X, val_X, train_y, val_y)
    print("Max leaf nodes: %d  \t\t Mean Absolute Error:  %d" %(max_leaf_nodes, my_mae))

找到有缺失值的columns，使用推导式：
推导式分为三个部分：col结果，for循环，if过滤条件；
col结果是根据if条件过滤而来的，过滤的范围是for循环。

# Get names of columns with missing values
cols_with_missing = [col for col in X_train.columns
                     if X_train[col].isnull().any()]

有时“直接drop掉含有缺失值的列”与“预测缺失值并填充进NAN处”相比，模型MAE会更小，为什么？
Answer：
由于模型中有些字段的值的缺失是有意义的，将这类值预测出来并填充反而加重了data的噪声。example：车库修建年份，这个字段的缺失值代表“房子没有车库”，这会影响到房子的价值，如果预测并填充进一个年份，会导致这组数据变成偏差很大的数据，noise。

猜你喜欢

转载自blog.csdn.net/weixin_42012759/article/details/109557696

Python-intro机器学习-笔记-20201109-HK

AI programming with python-Intro to python

Python-机器学习笔记-项目实战记录-20201130-HK

信号与系统(Python) 学习笔记摘录 (1) 信号简介 Intro

机器学习 - 1 Boosting&SVM - 20201028 - HK

机器学习 - 2 -SVM核函数 - 20201123 -HK

Kaggle课程 — 机器学习入门 Intro to Machine Learning

Python笔记 in 机器学习

机器学习的python笔记

python 机器学习笔记

Python 机器学习（笔记）

python机器学习笔记

（持续更新）Python-Pandas-笔记-20201102-HK

Part 01 : Intro to Python

Python机器学习笔记一

Python机器学习笔记：sklearn库的学习

《机器学习Python实践》学习笔记（一）

HK

intro

【机器学习笔记】Python机器学习基本语法

Python机器学习笔记01--机器学习基础

Python机器学习笔记集成学习总结 Python机器学习笔记——随机森林算法 Python机器学习笔记：XgBoost算法 Python机器学习笔记：Adaboost算法

《python与机器学习实战》笔记(一)

Python机器学习与实践笔记（一）

Python机器学习笔记：XgBoost算法

Python机器学习笔记——One Class SVM

【Python机器学习笔记】One Class SVM

Python机器学习及分析工具笔记

Python机器学习笔记-1（线性回归）

python机器学习及分析工具《笔记》

今日推荐

手把手教你用 LangChain 实现大模型 Agent

外星人入侵（python）

超全的免费chatGPT列表【建议收藏】

52.2k star! 自己部署gpt4free, 免费使用各种GPT

2024年（第十届）全国大学生统计建模大赛优秀论文解析——中国经济发展与碳排放库兹涅茨曲线的验证研究

【自动驾驶技术】自动驾驶汽车AI芯片汇总——NVIDIA篇

7个免费的ChatGPT网站，给大家送上

Angular v18 正式发布！

【VMware】 vCenter Converter standalone 6.6.0正式版下载

开源日报 | Angular v18；大模型价格战下的推理优化；Mistral AI以开源模型瞄准美国市场；硅谷有自己的鲁迅

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

周排行

keepalived实现LB配置

数据库相关中间件收录集

Spring Boot 入门之 Web 篇（二） Spring Boot 入门之 Web 篇（二）

gitee 搭建个人网站

Java校招基础知识总结（横扫BAT,就业经验交流会演讲稿）

工程管理器

Delphi定位TDataSet数据集最后一条记录

cocos2dx笔记1:概述

Java实现 LeetCode 110 平衡二叉树

MacBook IDEA激活码

每日归档

更多

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)