一、机器学习-------Machine learning
1、主要应用:
(1)database mining 数据挖掘
比如 硅谷公司 收集点击量,来对用户的信息和喜好进行采集
比如电子医疗记录 -----转换为医疗知识
生物学家采集的数据帮助理解基因组
都有越来越多的数据集
(2)applications can`t program by hand
手写识别:机器学习算法会自动识别你的笔迹判断目的地
(3)self-customizing programs
个性化推荐算法
二、what is machine learning
1.定义:
(1)来自于Arthur Samuel(1959)
Field of study that gives computers the ability to learn without being explicitly programmed.
(在进行特定编程的情况下,给予计算机学习能力的领域)
(2)Tom Mitchell(1998)
well-posed learning problem:a computer program is said to learn from experience E with respect to some task T and some performance measure P,if its performance on T as measured by P improves with experience E.
(一个好的问题被定义为:一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升)
2,machine learning algorithms:
(1) supervised learning
(2) Unsupervised learning
others:reinnforcement learning, recommender systems
三、supervised learning
supervised learning refers to :the fact that we gave the algorithm a data set in which the"right ansers" were given.
(即给出一个算法,需要部分数据集已经有正确的答案)
监督学习又叫做 回归问题(A regression problem):指要预测一个连续值的输出种类
比如二分类问题(classification ):预测一个离散值输出
四、Unsupervised learning
1.第一种常见的是聚类:在无监督的学习中,数据集是没有标签和属性的,即他们看起来都是一样的,可能判断出对于某个数据集,有明显的聚集关系,因此可以分成几个聚类。
即我们无法给这个学习一个正确答案。无法确定这个数据集到底有哪些特征
聚类---例如用于以下场景:
①Organize computing clusters
②social network analysis
③market segmentation
④astronomical data analysis
2.Cocktail party problem algoritnm(鸡尾酒会算法)
[W,s,v] = svd((repmat(sum(x,*x,1),size(x,1),1).*x)*x`)
上面这行代码就可以完成对声音的分离(方程中的svd就是奇异值分解,一个用于解线性方程的函数)
octave 编程环境
一般都是先用octave写一个程序原型,确定这个算法可以正常工作之后,才将这个算法移植到其他语言比如C++、java等
附:单词
remarkable result 令人瞩目的成果