文章目录
前言
统计学习或机器学习一般包括监督学习、无监督学习、强化学习,有时还包括半监督学习和主动学习。
一、监督学习
1.监督学习的概念
监督学习:指的是从标注数据中学习预测模型的机器学习问题,其本质就是学习输入到输出的映射的统计规律。
2.监督学习相关概念
- 输入空间:输入的所有可能取值的集合
- 实例:每一个具体的输入,通常是由特征向量表示
- 特征空间:所有特征向量存在的空间
- 输出空间:输出的所有可能取值的集合
3.研究问题的分类
- 输入变量与输出变量均为连续变量的预测问题——回归问题
- 输出变量为有限个离散变量的预测问题——分类变量
- 输入变量与输出变量均为变量序列的预测问题——标注问题
4.符号表示
(1)符号表示
- 输入变量:X; 输入变量的取值:x
- 输出变量:Y; 输出变量的取值:y
- 输入实例x的特征向量表示:
这个表示x的几个特征 - 以xi表示多个输入变量中第i个变量
- 样本容量为N的训练集
(2)基本概念
- 监督学习的基本假设:X和Y具有联合概率分布P(X,Y)
- 监督学习的目的:学习一个输入到输出的映射,这一映射以模型表示
- 模型的形式:条件概率分布P(Y|X)或决策函数Y=f(X)
- 假设空间:所有这些可能模型的集合。
对具体的输入进行相应的输出预测时,表示为:P(y|x)或者y=f(x)
监督学习的流程图:
监督学习分为学习和预测两个过程
二、无监督学习
1.无监督学习的概念
无监督学习:指的是无标注数据中学习预测模型的机器学习问题,其本质是学习数据中的统计规律或潜在结构。
监督学习和无监督学习的对比:
2.无监督学习相关概念
- 输入空间: χ \chi χ
- 隐式结构空间: ζ \zeta ζ
- 模型:函数z=g(x),条件概率分布P(z|x)或条件概率分布P(x|z)
- 假设空间:所有这些可能模型的集合
- 目的:选出在给定评价标准下的最优模型
- 样本容量为N的训练集: U = { x 1 , x 2 , … , x N } U =\{x_1,x_2,…,x_N\} U={
x1,x2,…,xN}
三、强化学习
强化学习是指智能系统在与环境的连续互动中学习最优行为策略的机器学习问题。其本质就是学习最优的序贯决策。
相关概念:
- S:有限状态集合
- A:有些动作集合
- P:状态转移概率函数P( s ⋅ s^· s⋅|s,a)=P(s t _t t + _+ + 1 _1 1= s ⋅ s^· s⋅|s t _t t=s,a t _t t=a)
- r:奖励函数 r(s,a)=E(r t _t t + _+ + 1 _1 1|s t _t t=s,a t _t t=a)
- γ \gamma γ:衰减函数 γ \gamma γ ∈ \in ∈ [ 0 , 1 ] [0,1] [0,1]
强化学习的目标就是在所有可能的策略中选出价值函数最大的策略 π \pi π ∗ ^* ∗,在实际学习中往往从具体的策略出发,不断优化已有策略。
四、半监督学习与主动学习
- 半监督学习:是指利用标注数据和未标注数据学习预测模型的机器学习问题。通常是少量标注数据和大量未标注数据(降低成本)。本质就是利用未标注数据中的信息来辅助标注数据进行监督学习,以较低的成本达到较好的学习效果。
- 主动学习:是指机器学习不断主动给出实例让教师进行标注,然后利用标注数据学习预测模型的机器学习问题。通常给定的标注数据往往是随机得到的。主动学习的目的是找出对学习最有帮助的实例让教师标注,以较小的标注代价,达到较好的学习效果。