【机器学习课程-华盛顿大学】：2 回归 2.5 Lasso Regression - 代码天地

【机器学习课程-华盛顿大学】：2 回归 2.5 Lasso Regression

其他 2018-06-14 05:07:42 阅读次数: 2

特征选择正则化：Lasso Regression

当特征很多且稀疏时，计算非0：

另外，知道哪些特征才是有效特征，比如：对于房价的决定因素有哪些至关重要。

一、特征选择方法一：列举所有子集

特征数和RSS误差平方和的关系：

一开始，特征数越多，误差越小；接下来随着特征数的增加，RSS误差会不再减少。

另外：

当1个特征时，最优特征为：sq.ft. living

当2个特征时，最优特征为：bedrooms和bathrooms。

结论：特征size=k情况下的最优特征，可能并不包含特征size=k-1下的最优特征。

复杂度：

二、特征选择方法二：贪婪算法

一开始先随机选择1个特征，选择1个特征中RSS误差最小的。

然后再加入一个特征，选择使得联合误差最小的特征加入。

再加入一个特征，依旧选择使得联合误差最小的特征加入。

不断循环，直到验证集（而不是训练集、测试集）误差不再减小，停止算法。

复杂度分析：

三、特征选择方法三：正则化

1、Ridge Regression岭回归：L2正则化

使得w足够小，但并不会完全为0

岭回归下的系数变化：

2、Lasso Regression:L1正则化

Lasso回归下的系数随着lambda增大的变化：

四、正则化可视化

1、Ridge Regression岭回归cost可视化

（1）RSS部分：椭圆形eclipse

(2)第二部分：L2 圆形 circle

(3)2部分合并：椭圆形eclipse

2、Lasso回归

（1）第一部分：RSS部分，跟Ridge一样

（2）第二部分：L1

（3）两部分合并

五、最优化Lasso回归cost

之前对于L2求w的方法（梯度为0，梯度下降）已经不管用了，因为L1 |w|的梯度为：

1、coordinate descent坐标下降法

一次所有坐标都最小不可能，那么我们换个思路，每次固定其他所有坐标，只让1个坐标的数最小。

（1）初始化w0---wn

（2）如果算法不收敛：则选择一个wj，其他所有wi都保持不变，求使得cost最小时的wj。

2、归一化特征

按列归一化：

将测试数据都除以归一化因子：

3、坐标下降

（1）特征归一化、非正则化场景下的坐标下降

（2）最小平方回归的坐标下降：

（3）Lasso回归下的坐标下降：

猜你喜欢

转载自blog.csdn.net/weixin_41770169/article/details/80651084

【机器学习课程-华盛顿大学】：2 回归 2.5 Lasso Regression

【机器学习课程-华盛顿大学】：2 回归 2.4 岭回归Ridge Regression

【人工智能】机器学习：岭回归与LASSO回归(Ridge/LASSO Regression)

线性回归——lasso回归和岭回归（ridge regression）

机器学习方法：回归（二）：稀疏与正则约束ridge regression，Lasso

Lasso Regression

四、套索回归 (Lasso Regression)的基本应用

机器学习--Lasso回归和岭回归

[机器学习] - 岭回归与Lasso回归

机器学习-regression回归

【机器学习课程-华盛顿大学】：2 回归 2.6 总结

Lasso回归

LASSO 回归

机器学习入门线性回归岭回归与Lasso回归(二)

机器学习总结(一)：线性回归、岭回归、Lasso回归

机器学习：线性回归、岭回归、Lasso回归

机器学习之线性回归、岭回归、Lasso回归

【机器学习】正则化的线性回归 —— 岭回归与Lasso回归

python机器学习库scikit-learn: Lasso Regression

机器学习 of python(岭回归和Lasso回归)

岭回归，LASSO和LAR学习

岭回归与Lasso回归

Ridge回归、Lasso回归

岭回归、LASSO回归

回归问题-Lasso回归

回归问题-Lasso回归

Lasso回归与岭回归

【机器学习课程-华盛顿大学】：2 回归 2.6 非参数化：最近邻和核回归

【机器学习课程-华盛顿大学】：2 回归 2.2 多元线性回归

【机器学习课程-华盛顿大学】：2 回归 2.1 线性回归模型

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)