CS229 Machine Learning学习笔记:Note 5(正则化与模型选择)

其他 2018-07-16 20:05:44 阅读次数: 0

模型选择

假设目前有d个学习模型构成的集合\(\mathcal M=\{M_1,\cdots,M_d\}\)，训练集S，下面介绍几种选取模型的方法

Hold-out cross validation(Simple cross validation)

1.按一定比例随机将原始训练集S分为训练集\(S_{train}\)和交叉验证集\(S_{CV}\)，一般比例为7:3
2.依次用\(S_{train}\)训练每个模型
3.用\(S_{CV}\)上的经验误差估计每个模型的泛化误差，最终选取\(h_i\)在\(S_{CV}\)上的经验误差\(\hat \varepsilon_{S_{CV}}(h_i)\)最小

但是这一方法在训练过程中丢失了一部分数据(\(S_{CV}\))，在原始训练集大小很小时，这一方法并不适用

K-fold cross validation

1.随机将大小为m的原始训练集S划分成k个互不重复的子集\(S_1,\cdots,S_k\)，每个子集有\(\frac m k\)个训练样本。
2.对每个模型\(M_i\)，按以下方法估计泛化误差：

For j=1...k{
____用除\(S_j\)外的其他数据训练\(M_i\)得到假设函数\(h_{i,j}\)
____在\(S_j\)上测试\(h_{i,j}\)得到经验误差\(\hat \varepsilon_{S_j}(h_{i,j})\)
}
取\(\hat \varepsilon_{S_j}(h_{i,j})\)的平均值为对模型\(M_i\)的泛化误差的估计

一般k=10，但当原始训练集大小实在太小的时候，会选择极端的k=m，以使得每次训练时丢掉最少的数据，这种交叉验证方法叫Leave-one-out cross validation。

特征选择

当训练样本的特征数n远大于训练样本数目m时，即使使用只有n个左右参数的线性分类器(如感知机)，根据Note 4的结论，至少要有\(O(n)\)个训练样本才能使模型最终表现良好。因此，此时面临严重的过拟合问题。

假设特征中只有少量特征与学习任务有关，现在要从n种特征中保留其中若干种特征。最简单粗暴的办法就是枚举所有\(2^n\)种选择方案，但这种方法显然计算量太大。

下面介绍几种高效的特征选取算法。

前向搜索(Forward search)

1.初始化\(\mathcal F\)为空集
2.执行以下循环：

Repeat until \(|\mathcal F|=n\)或\(|\mathcal F|\geq t\)(阈值){
____For i=1...n{
________若\(i \notin \mathcal F\)，令\(\mathcal F_i=\mathcal F\cup \{i\}\)，用上述的某种交叉验证方法估计保留特征\(\mathcal F_i\)并训练后，得到的泛化误差
____}
____选取泛化误差最小的\(\mathcal F_i\)，令\(\mathcal F:=\mathcal F_i\)
}

猜你喜欢

转载自www.cnblogs.com/qpswwww/p/9319773.html

CS229 Machine Learning学习笔记:Note 5(正则化与模型选择)

CS229 Machine Learning学习笔记

CS229 Machine Learning学习笔记:Note 12(强化学习与自适应控制)

CS229 Machine Learning学习笔记:Note 3(支持向量机、SMO算法)

CS229 Machine Learning学习笔记:Note 8(EM算法)

CS229 Machine Learning学习笔记:Note 9(因子分析)

CS229 Machine Learning学习笔记:Note 10(主成分分析PCA)

CS229 Machine Learning作业代码:Problem Set 1

CS229 Machine Learning作业代码:Problem Set 2

CS229 Machine Learning Stanford Course by Andrew Ng

CS229学习笔记

cs229 机器学习

机器学习 cs229学习笔记5 ICA Independent components analysis

cs229 斯坦福机器学习笔记（一）-- 入门与LR模型

CS229学习笔记（3）

CS229学习笔记（4）

CS229学习笔记（2）

CS229学习笔记（1）

CS229学习笔记（0）

第5周 | 斯坦福 CS229 机器学习

机器学习cs229——（一）概要

机器学习与深度学习系列连载（NTU-Machine Learning, cs229, cs231n, cs224n, cs294）：欢迎进入机器学习的世界

机器学习资源集合初探 cs229 斯坦福机器学习笔记（一）-- 入门与LR模型 cs229 斯坦福机器学习笔记（二）-- LR回顾与svm算法idea理解

机器学习（CS229）笔记二：监督学习之逻辑回归和广义线性模型

【CS229 Deep Learning笔记】二. 介绍：分类问题

机器学习cs229——（三）局部加权回归、逻辑回归、感知器、牛顿方法、广义线性模型

cs229 学习笔记四学习理论

机器学习学习笔记2（Ng课程cs229）

机器学习学习笔记1（Ng课程cs229）

机器学习 cs229学习笔记1

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)