目录
Part one.人工智能、机器学习和深度学习
一、人工智能
1.人工智能定义
研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新兴学科。
2.人工智能分类
弱人工智能:认为不可能制造出能真正进行推理和解决问题的智能机器,这些机器看起来像智能的,但是并不真正拥有智能,也不会有自主意识(悲观派)
强人工智能:认为有可能制造出真正能推理和解决问题的智能机器,这样的机器被认为是有自主意识的 (乐观派)
超级人工智能:机器的智能彻底超过了人类(超乐观派)
二、机器学习
1.机器学习定义
让计算机具有像人一样的学习和思考能力的技术的总称。具体来说是从已知数据中获得规律,并利用规律对未知数据进行预测的技术
2.机器学习分类
有监督学习(Supervised Learning):有老师(环境)的情况下,学生(计算机)从老师(环境)那里获得对错指示、最终答案的学习方法。跟学师评。简言之数据集有标签。例如:分类、回归
无监督学习( Unsupervised Learning):没有老师(环境)的情况下,学生(计算机)自学的过程,一般使用一些既定标准进行评价。自学标评。简言之数据集没有标签 。例如:聚类、降维
强化学习(Reinforcement Learning):没有老师(环境)的情况下,学生(计算机)对问题答案进行自我评价的方法,重点是能够从环境中得到反馈。自学自评。简言之大部分数据集没有标签,少部分数据集有标签。例如:对弈
3.常见的机器学习方法
三、深度学习
1.深度学习定义
深度学习一般是指通过训练多层网络结构对未知数据进行分类或回归
2.深度学习分类
有监督学习方法:深度前馈网络、卷积神经网络、循环神经网络等
无监督学习方法:深度信念网、深度玻尔兹曼机,深度自编码器,生成对抗网络等
3.为什么使用深度学习
比如说我们要做一个classification,这个任务是我要区分这是不是一个车。现实中,可能有不同大小的不同角度的车的图像,车会有不同的尺度,不同的方向,甚至不同的颜色之类的。要分出这个车,就要知道这个结构,因此会设计一些feature,比如说我们最常用的车的一个feature是seat。为了克服这种不同尺度以及不同角度,需要这个找到他的局部极大值,然后在这个极大值上面,用它的梯度的直方图来表示它的结构,这个梯度直方图就可以表现他的边缘的方向以及他的统计分布特性。然后把这个特征放在一个机器学习的模型里,比如说很常用的SVM,然后进行训练和分类。
那这里面,影响机器学习性能的因素变成了两个:第一个是模型合不合适,比如SVM里面有不同的参数的选取,当然这个可以通过以目的为驱动的训练来尽可能的逼近最好的结果;第二个因素是特征的表示,如果这个特征不能很好地表示这个物体,或者是实现这个应用,那即使后面的模型再好,也很难得到很好的性能。比如在这里我不用seat,只用颜色。但是颜色完全不可能判别这个是不是一个车,所以你即使用再好的分类器,也不可能把车分类出来。你后面即使是用卷积网络之后特别好,特别多,然后,但是你前面输入的这个信息就完全不可能把它判别的话,那后面再好也不行。所以说在传统的这个机器学习领域,是很依赖于专业人士设计的这些feature的。
但是转到深度学习之后呢,人们就把特征提取和classification合到一起。这两部分都是通过以目的为驱动的训练的方式,比如说这种端到端的训练方式来得到。那这个时候呢,其实我不知道到底我训练出来这个feature是什么样的一个结构,或者是具有什么样的物理意义。我已经不太知道,因为他完全是大数据训练出来的一个过程。这就相当于变成了一个黑盒子,但是这个呢,它在一定程度上是以目的为驱动,如果数据量足够的话,他这个会训练出来在一定程度上表现这个物体(车)最好的特征。因此数据量足够大,而且网络结构也是相对合理的话,判别效果会超过我们传统的人工设计的方式的。
4.深度学习方法概貌
5.深度学习主要应用
(1)图像处理领域主要应用 :
- 图像分类(物体识别):整幅图像的分类或识别
- 物体检测:检测图像中物体的位置进而识别物体
- 图像分割:对图像中的特定物体按边缘进行分割
- 图像回归:预测图像中物体组成部分的坐标
(2)语音识别领域主要应用
- 语音识别:将语音识别为文字
- 声纹识别:识别是哪个人的声音
- 语音合成:根据文字合成特定人的语音
(3)自然语言处理领域主要应用
- 语言模型:根据之前词预测下一个单词。
- 情感分析:分析文本体现的情感(正负向、正负中或多态度类型)。
- 神经机器翻译:基于统计语言模型的多语种互译。
- 神经自动摘要:根据文本自动生成摘要。
- 机器阅读理解:通过阅读文本回答问题、完成选择题或完型填空。
- 自然语言推理:根据一句话(前提)推理出另一句话(结论)。
(4)综合应用
- 图像描述:根据图像给出图像的描述句子
- 可视问答:根据图像或视频回答问题
- 图像生成:根据文本描述生成图像
- 视频生成:根据故事自动生成视频
Part Two.中英文术语对照
❑人工智能:Artificial Intelligence
❑计算智能:Computational Intelligence
❑感知智能:Perceptual Intelligence
❑认知智能:Cognitive Intelligence
❑机器学习:Machine Learning
❑有监督学习:Supervised learning
❑无监督学习:Unsupervised learning
❑增强学习:Reinforcement Learning
❑神经元:Neuron
❑感知器:Perceptron
❑神经网络:Neural Networks
❑反向传播算法: Back Propagation, BP
❑卷积神经网络:Convolutional Neural Network,CNN
❑深度学习:Deep Learning
❑梯度消失:Vanishing Gradient
❑修正线性单元:Rectified Linear Unit, ReLU
❑深度信度网:Deep Belief Networks
❑玻尔兹曼机:Boltzmann Machines
❑变分学习:Variational Learning
❑分类:Classification
❑递归:Recursion
❑深度信念网络:Deep Belief Network, DBN
❑深度玻尔兹曼机:Deep Boltzmann Machine, DBM
❑深度自编码器: Deep Auto-Encoder, DAE
❑降噪自编码器: Denoising Auto-Encoder, D-AE
❑栈式自编码器: Stacked Auto-Encoder, SAE
❑生成对抗网络: Generative Adversarial Networks,GAN
❑非参数贝叶斯网络: Non-parametric Bayesian Networks
❑深度前馈网络: Deep Feedforward Neural Network, D-FNN
❑卷积神经网络: Convolutional Neural Network, CNN
❑循环神经网络: Recurrent Neural Network, RNN
❑胶囊网络: Capsule Net
❑深度森林: Deep Forest
❑图像分类(物体识别): Image Classification (Object Recognition)
❑物体检测:Object Detection
❑图像分割:Image Segmentation
❑图像回归:Image Regression
❑语音识别:Automatic Speech Recognition, ASR
❑声纹识别:Voiceprint Recognition
❑语音合成:Speech Synthesis
❑语言模型:Language Model
❑情感分析:Sentiment Analysis
❑神经机器翻译:Neural Machine Translation, NMT
❑神经自动摘要:Neural Automatic Summarization
❑机器阅读理解:Machine Reading Comprehension, MRC
❑自然语言推理:Natural Language Inference, NLI
❑文本蕴含:Text Entailment