统计学习方法——第2章感知机（个人笔记） - 代码天地

统计学习方法——第2章感知机（个人笔记）

企业开发 2023-12-18 07:15:58 阅读次数: 0

统计学习方法——第2章感知机（个人笔记）

参考《统计学习方法》（第二版）李航

感知机就是二分类的线性分类模型，输入为特征向量，输出只为+1、-1。

2.1 感知机模型

模型为：

$f(x)=sign(w\cdot x+b)$

其中， $w$ 为权重or权值， $b$ 为偏置， $x$ 为特征向量。

$sign$ 为符号函数：

$sign(x)=\left\{\begin{matrix} +1, &x\geq 0 \\ -1, &x< 0 \end{matrix}\right.$

假设感知机在二维平面，感知机可为线性方程：

$w\cdot x+b=0$

例图如下，

感知机为超平面， $w$ 为超平面的法向量， $b$ 为超平面的截距。

2.2 感知机学习策略

2.2.1 数据集的线性可分性

给定一个数据集：

$T=\{(x_1,y_1),\left. \cdots , \right(x_n,y_n) \}$

如果存在感知机模型（即为超平面S）使得数据集的正样本和负样本完全正确划分，则称为T为线性可分数据集，反之，为线性不可分数据集。

2.2.2 感知机学习策略

感知机的学习目标就是找到能将训练集的正负样本分开的超平面，也就是确定模型参数 $w,b$ 。

学习策略就是找到损失函数并使损失函数极小化。

首先，输入空间任意一点 $x_0$ 到超平面S的距离为：

$\frac{1}{\left \| w \right \|}|w\cdot x_0+b|$

其中， $\left \| w \right \|$ 为 $w$ 的 $L_2$ 范数。

对于误分类的数据：

$-y_i(w\cdot x_i+b)>0$

恒成立，当 $w\cdot x_i+b>0$ ， $y_i=-1$ ,当 $w\cdot x_i+b<0$ ， $y_i=+1$ 。

这样，所有误分类点到超平面S的距离为：

$-\frac{1}{\left \| w \right \|}\sum_{x_i}^{}y_i(w\cdot x_i+b)$

若不考虑 $\left \| w \right \|$ ，则损失函数为

$L(w,b)=-\sum_{x_i}^{}y_i(w\cdot x_i+b)$

若没有误分类点，损失函数为0。

2.3 感知机学习算法

2.3.1 感知机学习算法的原始形式

求参数 $w,b$ ，使得

$\min L(w,b)=-\sum_{x_i}^{}y_i(w\cdot x_i+b)$

对 $w,b$ 分别求导，

$\bigtriangledown _wL(w,b)=-\sum_{x_i}^{}y_ix_i$

$\bigtriangledown _bL(w,b)=-\sum_{x_i}^{}y_i$

随机选取误分类点 $(x_i,y_i)$ ，w,b进行更新

$w=w+\eta y_ix_i$

$b=b+\eta y_i$

其中， $\eta(0<\eta \leq 1)$ 为学习步长。

一直更新，直至没有误分类点。

2.3.2 算法的收敛性

略

2.3.3感知学习算法的对偶形式

对偶形式的基本想法是，将w和b表示为实例 $x_i$ 和标记 $y_i$ 的线性组合的形式通过求解其系数来求得w和b。

$w=w+\eta y_ix_i$

$b=b+\eta y_i$

假设修改N次，令 $\alpha _i=n_i\eta$ ，则上式变为

$w=\sum_{i=1}^{N}\alpha _iy_ix_i$

$b=\sum_{i=1}^{N}\alpha _iy_i$

算法2.2 感知机学习算法的对偶形式

感知机模型：

$f(x)=sign\left ( \sum_{j=1}^{N}\alpha _jy_jx_j\cdot x+b \right )$

（1）a=0,b=0

（2）训练集选取 $(x_i,y_i)$

（3）如果 $y_i\left ( \sum_{j=1}^{N}\alpha _jy_jx_j\cdot x_i \right )\leq 0$ ，则

$\alpha _i=\alpha _i+\eta$

$b=b+\eta y_i$

（4）转至（2）直至没有误分类数据。

猜你喜欢

转载自blog.csdn.net/pk296256948/article/details/123949479

统计学习方法——第2章感知机（个人笔记）

统计学习方法第2章感知机

【统计学习方法读书笔记】感知机的个人理解（2）

统计学习方法-第2章-感知机(1)

《统计学习方法》第 2 章感知机可视化

统计学习方法 | 第2章感知机 | 补充

统计学习方法——第1章（个人笔记）

统计学习方法——第7章支持向量机（个人笔记）

统计学习方法：（读书笔记）------ 第二章感知机与统计学习方法总结

【统计学习方法by李航】第二章感知机个人总结

统计学习方法——学习笔记之感知机

【统计学习方法读书笔记】感知机的个人理解（1）

统计学习方法（2）感知机

统计学习方法（2）——感知机

统计学习方法2 - 感知机

[笔记-统计学习方法]感知机 perceptron

统计学习方法笔记（五）感知机算法

统计学习方法笔记-感知机

统计学习方法笔记——感知机

《统计学习方法》读书笔记——感知机

《统计学习方法》笔记二感知机

《统计学习方法》感知机——读书笔记

统计学习方法笔记---感知机

统计学习方法笔记（1）—感知机

学习笔记_第二章感知机-《统计学习方法》李航

统计学习方法 | 感知机

《统计学习方法》——感知机

统计学习方法 --- 感知机

统计学习方法——感知机

《统计学习方法》笔记第二章 —— 感知机

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)