比如说我们要做一个classification，这个任务是我要区分这是不是一个车。现实中，可能有不同大小的不同角度的车的图像，车会有不同的尺度，不同的方向，甚至不同的颜色之类的。要分出这个车，就要知道这个结构，因此会设计一些feature，比如说我们最常用的车的一个feature是seat。为了克服这种不同尺度以及不同角度，需要这个找到他的局部极大值，然后在这个极大值上面，用它的梯度的直方图来表示它的结构，这个梯度直方图就可以表现他的边缘的方向以及他的统计分布特性。然后把这个特征放在一个机器学习的模型里，比如说很常用的SVM，然后进行训练和分类。

那这里面，影响机器学习性能的因素变成了两个：第一个是模型合不合适，比如SVM里面有不同的参数的选取，当然这个可以通过以目的为驱动的训练来尽可能的逼近最好的结果；第二个因素是特征的表示，如果这个特征不能很好地表示这个物体，或者是实现这个应用，那即使后面的模型再好，也很难得到很好的性能。比如在这里我不用seat，只用颜色。但是颜色完全不可能判别这个是不是一个车，所以你即使用再好的分类器，也不可能把车分类出来。你后面即使是用卷积网络之后特别好，特别多，然后，但是你前面输入的这个信息就完全不可能把它判别的话，那后面再好也不行。所以说在传统的这个机器学习领域，是很依赖于专业人士设计的这些feature的。

但是转到深度学习之后呢，人们就把特征提取和classification合到一起。这两部分都是通过以目的为驱动的训练的方式，比如说这种端到端的训练方式来得到。那这个时候呢，其实我不知道到底我训练出来这个feature是什么样的一个结构，或者是具有什么样的物理意义。我已经不太知道，因为他完全是大数据训练出来的一个过程。这就相当于变成了一个黑盒子，但是这个呢，它在一定程度上是以目的为驱动，如果数据量足够的话，他这个会训练出来在一定程度上表现这个物体（车）最好的特征。因此数据量足够大，而且网络结构也是相对合理的话，判别效果会超过我们传统的人工设计的方式的。

4.深度学习方法概貌

5.深度学习主要应用

（1）图像处理领域主要应用：

图像分类（物体识别）：整幅图像的分类或识别
物体检测：检测图像中物体的位置进而识别物体
图像分割：对图像中的特定物体按边缘进行分割
图像回归：预测图像中物体组成部分的坐标

（2）语音识别领域主要应用

语音识别：将语音识别为文字
声纹识别：识别是哪个人的声音
语音合成：根据文字合成特定人的语音

（3）自然语言处理领域主要应用

语言模型：根据之前词预测下一个单词。
情感分析：分析文本体现的情感（正负向、正负中或多态度类型）。
神经机器翻译：基于统计语言模型的多语种互译。
神经自动摘要：根据文本自动生成摘要。
机器阅读理解：通过阅读文本回答问题、完成选择题或完型填空。
自然语言推理：根据一句话（前提）推理出另一句话（结论）。

（4）综合应用

图像描述：根据图像给出图像的描述句子
可视问答：根据图像或视频回答问题
图像生成：根据文本描述生成图像
视频生成：根据故事自动生成视频

Part Two.中英文术语对照

❑人工智能：Artificial Intelligence

❑计算智能：Computational Intelligence

❑感知智能：Perceptual Intelligence

❑认知智能：Cognitive Intelligence

❑机器学习：Machine Learning

❑有监督学习：Supervised learning

❑无监督学习：Unsupervised learning

❑增强学习：Reinforcement Learning

❑神经元：Neuron

❑感知器：Perceptron

❑神经网络：Neural Networks

❑反向传播算法: Back Propagation, BP

❑卷积神经网络：Convolutional Neural Network，CNN

❑深度学习：Deep Learning

❑梯度消失：Vanishing Gradient

❑修正线性单元：Rectified Linear Unit, ReLU

❑深度信度网：Deep Belief Networks

❑玻尔兹曼机：Boltzmann Machines

❑变分学习：Variational Learning

❑分类：Classification

❑递归：Recursion

❑深度信念网络：Deep Belief Network, DBN

❑深度玻尔兹曼机：Deep Boltzmann Machine, DBM

❑深度自编码器: Deep Auto-Encoder, DAE

❑降噪自编码器: Denoising Auto-Encoder, D-AE

❑栈式自编码器: Stacked Auto-Encoder, SAE

❑生成对抗网络: Generative Adversarial Networks，GAN

❑非参数贝叶斯网络: Non-parametric Bayesian Networks

❑深度前馈网络: Deep Feedforward Neural Network, D-FNN

❑卷积神经网络: Convolutional Neural Network, CNN

❑循环神经网络: Recurrent Neural Network, RNN

❑胶囊网络: Capsule Net

❑深度森林: Deep Forest

❑图像分类（物体识别）: Image Classification (Object Recognition)

❑物体检测：Object Detection

❑图像分割：Image Segmentation

❑图像回归：Image Regression

❑语音识别：Automatic Speech Recognition, ASR

❑声纹识别：Voiceprint Recognition

❑语音合成：Speech Synthesis

❑语言模型：Language Model

❑情感分析：Sentiment Analysis

❑神经机器翻译：Neural Machine Translation, NMT

❑神经自动摘要：Neural Automatic Summarization

❑机器阅读理解：Machine Reading Comprehension, MRC

❑自然语言推理：Natural Language Inference, NLI

❑文本蕴含：Text Entailment

一只懒猪猪

发布了23 篇原创文章 · 获赞 23 · 访问量 23万+

私信关注

第一章：深度学习引言

Part one.人工智能、机器学习和深度学习

一、人工智能

1.人工智能定义

2.人工智能分类

二、机器学习

1.机器学习定义

2.机器学习分类

3.常见的机器学习方法

三、深度学习

1.深度学习定义

2.深度学习分类

3.为什么使用深度学习

4.深度学习方法概貌

5.深度学习主要应用

Part Two.中英文术语对照

猜你喜欢