机器学习读书笔记1

机器学习读书笔记1

1绪论

你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。

1.1基本术语

数据集是一组记录的集合X,每一个记录是对于一个对象的描述。
对于每一个样本xi,我们描述其d个属性(特征),于是产生了一个d维样本空间,同时每一个样本对应一个d维向量。
除了d个属性(特征),每一个对象还需要一个标记label(yi),即对象的分类类别。yi的集合Y是所以可能的类别,称为输出空间。
Y中是离散值,对应“分类”任务;Y中是连续值,对应“回归”任务。
通过数据学习得到模型的过程称为训练,结果是一个由输入集X到输出空间Y的映射。

监督学习:训练集有标记信息label,如分类和回归;
无监督学习:训练集无标记信息,如聚类。
学习得的模型适用于新样本的能力称为“泛化”能力。

1.2假设空间

样本每种属性可能的取值组合构成的集合,有(num1+1)(num2+1)……*(numd+1)+1个假设。
训练的结果就是找出和训练集一致的“假设集合”(假设空间的子集)。

猜你喜欢

转载自blog.csdn.net/terrygu000/article/details/113075872
今日推荐