ML入门（持续更新）

编程语言 2018-11-19 19:31:31 阅读次数: 0

评估方法：交叉验证法

交叉验证用于评估模型的预测性能，尤其是训练好的模型在新数据上的表现

划分数据集

训练集用于训练模型参数
验证集用于“训练”模型的超参数
测试集用于估计模型对样本的泛化误差

作用

可以在一定程度上减小过拟合。
可以从有限的数据中获取尽可能多的有效信息。

方法

留出法
k折交叉验证法
Bootstrapping自助采样法

正则化

作用：

保证模型尽可能的简单，避免过拟合。
参数值大小和模型复杂度是成正比的。参数过多会导致模型复杂度上升，越复杂的模型，越是会尝试对所有的样本进行拟合，甚至包括一些异常样本点。
约束模型特性，加入一些先验知识，例如稀疏、低秩等。

L0范数

L0是指向量中非0的元素的个数。

如果我们用L0范数来规则化一个参数矩阵W的话，就是希望W的大部分元素都是0。即让参数W是稀疏的。稀疏的好处：

简化模型，避免过拟合；
参数变少可以提高可解释性

但是，L0范数的最优化问题是一个NP hard问题，理论证明，L1范数是L0范数的最优凸近似，因此通常使用L1范数来代替。

L1范数

L1范数是指向量中各个元素绝对值之和。

L1正则化之所以可以防止过拟合，是因为它能产生等于0的权值，即产生稀疏的效果。参数值大小和模型复杂度是成正比的。因此复杂的模型，其L1范数就大，最终导致损失函数就大，说明这个模型就不够好。

L2范数

L2范数即欧式距离。

L2正则化之所以可以防止过拟合，是因为它是让各个参数接近于0。越小的参数说明模型越简单，越简单的模型越不容易产生过拟合现象。

L1稀疏、L2平滑

假定 $w_i>0$ ，L1的权值每次更新都固定减少一个特定的值，那么经过若干次迭代之后，权值就有可能减少到0。 $w_i=w_i-\eta$ 。( $w_i<0时则是增加到0$ )。
L2的权值更新公式为 $wi= wi- η * w_i$ ，假设 $\eta=0.5$ ，也就是说权值每次都等于上一次的1/2，那么，虽然权值不断变小，但是因为每次都等于上一次的一半，所以很快会收敛到较小的值但不为0。

因此

L1能产生等于0的权值，即产生稀疏的效果。
L2能迅速得到比较小的权值，但是难以收敛到0，即产生平滑的效果。

猜你喜欢

转载自blog.csdn.net/weixin_38493025/article/details/84241665

ML入门（持续更新）

Redis入门(持续更新)

python入门（持续更新）

并查集入门（持续更新！）

C++入门(持续更新)

【转】zookeeper入门系列（持续更新）

深度学习入门笔录（持续更新）

JavaScript基础入门学习————语法（持续更新）

Spring Boot 菜鸟入门（持续更新）

JavaScript基础入门学习————对象（持续更新）

Linux vi从入门到精通（持续更新）

OpenGL ES 2.0 入门（持续更新）

Redis入门学习笔记（持续更新）

RTKLib入门之路学习资源（持续更新）

python从入门到放弃（持续更新）

Docker从入门到实战(持续更新)

简单的html基础入门，持续更新中！！

入门mysql靠它就够了！！（持续更新）

python爬虫入门案例，持续更新

语义分割学习入门——持续更新中

Data Set：ML/DL常用数据集大集合(持续更新)

ML.NET 更新

持续更新

Go从入门到精通(持续更新) （山东数漫江湖）

ubuntu简单入门（四）macOSX主题bug修补（持续更新。。）

C++快速入门指南（持续更新中）

k8s入门(kubernetes)--持续学习更新

NLP-自然语言处理入门（持续更新）

Python3小白入门笔记 [疑惑篇](持续更新)

OGC入门学习专栏-1：OGC简介（持续更新）

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)