什么是激活函数

在神经网络中，我们会对所有的输入进行加权求和，之后我们会在对结果施加一个函数，这个函数就是我们所说的激活函数。如下图所示。

为什么使用激活函数

我们使用激活函数并不是真的激活什么，这只是一个抽象概念，使用激活函数时为了让中间输出多样化，能够处理更复杂的问题。

如果不适用结果函数的话，每一层最后输出的都是上一层输入的线性函数，不管加多少层神经网络，我们最后的输出也只是最开始输入数据的线性组合而已。激活函数给神经元引入了非线性因素，当加入多层神经网络时，就可以让神经网络拟合任何线性函数及非线性函数，从而使得神经网络可以适用于更多的非线性问题，而不仅仅是线性问题。

有论文中把激活函数定义为一个几乎处处可微的函数f: R->R

有哪些激活函数

对于神经网络，一版我们会使用三种激活函数：Sigmoid函数、Tanh函数、ReLU函数。

基本概念：

饱和：

当函数f(x)满足：

$\lim_{x\rightarrow+\infty}f^{'}(x)=0$

时，称为右饱和；

当函数f(x)满足：

$\lim_{x\rightarrow-\infty}f^{'}(x)=0$

时，称为左饱和。

当f(x)同事满足左饱和及右饱和时，称为饱和。

软包和与硬包和：

在饱和定义的基础上，如果存储常数c1，当x>c1时候恒满足 $f^{'}(x)=0$ ，称之为右硬饱和；同样的，如果存在c2，当x<c2时恒满足 $f^{'}(x)=0$ ，称之为左硬饱和。如果同时满足了左饱和，又满足了右饱和，称之为硬包和。相对的，只有在x趋于极值时才能满足f(x)的倒数为0，则成为软饱和。