机器学习——决策树和随机森林 - 代码天地

机器学习——决策树和随机森林

企业开发 2018-08-17 08:54:08 阅读次数: 0

决策树：从根节点开始一步步走到叶子节点（决策），所有的数据最终都会落到叶子节点，既可以做分类也可以做回归

决策树思想，实际上就是寻找最纯净的划分方法，这个最纯净在数学上叫纯度，纯度通俗点理解就是目标变量要分得足够开（y=1的和y=0的混到一起就会不纯）。另一种理解是分类误差率的一种衡量。实际决策树算法往往用到的是，纯度的另一面也即不纯度，下面是不纯度的公式。不纯度的选取有多种方法，每种方法也就形成了不同的决策树方法，比如ID3算法使用信息增益作为不纯度；C4.5算法使用信息增益率作为不纯度；CART算法使用基尼系数作为不纯度。

树的组成
根节点：第一个选择点
非叶子节点与分支：中间过程
叶子节点：最终的决策结果

决策树的衡量标准——熵

熵：熵是表示随机变量不确定性的度量（解释：说白了就是物体内部的混乱程度，比如杂货市场里面什么都有
那肯定混乱呀，专卖店里面只卖一个牌子的那就稳定多啦）

我们在学习决策树的时候——如何决策一个节点的选择呢？

信息增益：表示特征X使得类Y的不确定性减少的程度。（分类后的专一性，希望分类后的结果是同类在一起）

决策树剪枝策略
为什么要剪枝：决策树过拟合风险很大，理论上可以完全分得开数据（想象一下，如果树足够庞大，每个叶子节点不就一个数据了嘛）
剪枝策略：预剪枝，后剪枝
预剪枝：边建立决策树边进行剪枝的操作（更实用）
后剪枝：当建立完决策树后来进行剪枝操作

集成算法：

Bagging模型
全称： bootstrap aggregation（说白了就是并行训练一堆分类器）
最典型的代表就是随机森林啦
森林：很多个决策树并行放在一起
随机：数据采样随机，特征选择随机

随机森林——构造树模型

随机森林优势
它能够处理很高维度（feature很多）的数据，并且不用做特征选择
在训练完后，它能够给出哪些feature比较重要
可以进行可视化展示，便于分析
容易做成并行化方法，速度比较快

猜你喜欢

转载自blog.csdn.net/liushuichengshang/article/details/81745453

关于决策树和随机森林的学习【机器学习】--决策树和随机森林

机器学习-决策树、随机森林

随机森林与决策树--机器学习

机器学习（决策树与随机森林）

机器学习——决策树与随机森林

[机器学习]决策树和随机森林算法简介

机器学习——决策树和随机森林

机器学习算法 | 决策树和随机森林

机器学习——决策树和随机森林算法

机器学习——4 决策树和随机森林

机器学习_决策树和随机森林

机器学习之决策树与随机森林

【机器学习详解】决策树与随机森林算法

[三]机器学习之决策树与随机森林

【机器学习】决策树与随机森林（转）

机器学习决策树随机森林算法

机器学习算法--决策树与随机森林

机器学习基础之（二）决策树及随机森林

【机器学习（五）】从决策树到随机森林

机器学习之决策树、随机森林

机器学习系列(7)_决策树与随机森林概念

机器学习之决策树及随机森林

自学机器学习之sklearn实现决策树和随机森林及其参数的解释

[机器学习算法]决策树CART和随机森林模型

Spark MLlib机器学习库(一)决策树和随机森林案例详解

机器学习算法：线性回归、逻辑回归、决策树和随机森林解析

集成学习 - 决策树-随机森林

机器学习笔记10-----决策树与随机森林1---随机森林概述

决策树和随机森林

CART决策树和随机森林

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)