02 机器学习任务攻略-学习笔记-李宏毅深度学习2021年度

企业开发 2022-05-14 01:44:17 阅读次数: 0

上篇 01 机器(深度)学习介绍-学习笔记-李宏毅深度学习2021年度

下篇 03 梯度（Gradient）很小怎么办（Local Minima与Saddle Point）-学习笔记-李宏毅深度学习2021年度

本节内容及相关链接

模型训练的一些指导意见

课程笔记

训练数据集，符号表示： $\left\{\left(x^{1}, \hat{y}^{1}\right),\left(x^{2}, \hat{y}^{2}\right), \ldots,\left(x^{N}, \hat{y}^{N}\right)\right\}$

测试数据集，符号表示： $\left\{x^{N+1}, x^{N+2}, \ldots, x^{N+M}\right\}$

train 不起来的排查思路：

在这里插入图片描述
各文字的含义：

loss on traing data: 检查train data的loss
loss on traing data -> large：train data的loss比较大
model bias：模型欠拟合了，即不够复杂
optimization：考虑优化optimization
loss on traing data -> small：train data的loss比较小
loss on testing data：检查testing data的loss
loss on testing data -> large：testing data的loss比较大
overfitting：发生了overfitting
mismatch：发生了mismatch
loss on testing data -> small: testing data的loss比较小，模型训练没问题

总结：

模型在train data上的loss很大，说明模型发生了 model bias，解决方案为：

增加模型复杂度
优化Optimization，请参考下篇

模型在train data上的loss小，但在testing data的loss大，说明模型发生了overfitting 或 mismatch。

overfitting含义：模型过度拟合了train data，即过度遵循了train data的规律，导致泛化能力变差

overfitting解决方案为：

收集更多数据
进行数据增强
简化模型（减少模型参数，使用共享参数，减少features数量，early stopping提前终止，Regularization正则化，Dropout 等）

mismatch的含义：train data的分布与testing data 不一致。例如：train data都是黑白图片，testing data却都是彩色图片

交叉验证：将traing set 多次分组，分为训练集和验证集，最终取平均loss最好的那个模型

交叉验证实用场景：在train data 和 validation data上表现都不错，但在testing data（可以理解为真实环境）上表现较差
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/zhaohongfei_358/article/details/123134544

02 机器学习任务攻略-学习笔记-李宏毅深度学习2021年度

李宏毅机器学习笔记-02 Regression

01 机器(深度)学习介绍-学习笔记-李宏毅深度学习2021年度

【李宏毅2021机器学习深度学习】2-1 机器学习任务攻略

04 自动调整学习率（Learning Rate）-学习笔记-李宏毅深度学习2021年度

机器学习笔记（李宏毅 2021/2022）——第二节：机器学习攻略任务

03 梯度（Gradient）很小怎么办（Local Minima与Saddle Point）-学习笔记-李宏毅深度学习2021年度

机器学习笔记02

【李宏毅2021机器学习深度学习】作业讲解

【李宏毅2021机器学习深度学习】Transform

2-1 李宏毅2021春季机器学习教程-第二节机器学习任务攻略

李宏毅老师2021深度学习课程笔记

李宏毅《机器学习深度学习》简要笔记（一）

2021李宏毅机器学习课程笔记——Auto Encoder

学习02

2021-02-02

李宏毅机器学习-学习笔记

【02】机器学习绪论

机器学习前沿02

机器学习入门02

机器学习 - Python 02

机器学习02

机器学习02——KNN

前端学习 02 —— CSS 02

【ML】李宏毅机器学习笔记

李宏毅机器学习笔记

李宏毅机器学习笔记(5)

李宏毅机器学习笔记（4）

李宏毅机器学习笔记（3）

李宏毅机器学习笔记（2）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)