神经网络为什么需要激活函数 - 代码天地

神经网络为什么需要激活函数

其他 2020-02-21 20:59:31 阅读次数: 0

给定一个只含有一层隐藏层的感知机模型，给定一个小批量样本 $X\in\mathbb{R}^{n\times d}$ ，其批量大小为n，输入个数为d。感知机隐藏单元个数为h。记隐藏层的输出（也称为隐藏层变量或隐藏变量）为H，有 $H\in\mathbb{R}^{n\times h}$ 。因为隐藏层和输出层均是全连接层，可以设隐藏层的权重参数和偏差参数分别为 $W_h\in\mathbb{R}^{d\times h}$ 和 $b_h\in\mathbb{R}^{1\times h}$ ，输出层的权重和偏差参数分别为 $W_o\in\mathbb{R}^{h\times q}$ 和 $b_o\in\mathbb{R}^{1\times q}$ 。

先来看一种含单隐藏层的多层感知机的设计。其输出 $O\in \mathbb{R}^{n\times q}$ 的计算为： $H=XW_h+b_h$ $O=HW_o+b_o$ 也就是将隐藏层的输出直接作为输出层的输入。如果将以上两个式子联立起来，可以得到 $O=(XW_h+b_h)W_o+b_o=XW_hW_o+b_hW_o+b_o$ 从联立后的式子可以看出，虽然神经网络引入了隐藏层，却依然等价于一个单层神经网络，其中输出层的权重参数为 $W_hW_o$ ，偏差参数为 $b_hW_o+b_o$ 。

不难发现，即使再添加更多的隐藏层，以上设计依然只能与仅含输出层的单层神经网络等价。

上述问题的根源在于全连接层只是对数据做仿射变换，而多个仿射变换的叠加仍然是一个仿射变换。解决问题的一个方法是引入非线性变换，例如对隐藏变脸使用按元素运算的非线性函数进行变换，然后再作为下一个全连接层的输入。这个非线性函数被称为激活函数。

常用的激活函数有ReLU函数，sigmoid函数和tanh函数。

发布了256 篇原创文章 · 获赞 10 · 访问量 8268

私信关注

猜你喜欢

转载自blog.csdn.net/qq_37388085/article/details/104373448

神经网络为什么需要激活函数

神经网络为什么需要非线性激活函数

为什么神经网络需要激活函数层？

为什么我们的神经网络需要激活函数

神经网络，深度学习，为什么要用激活函数？？？？？

为什么需要深度神经网络

为什么需要神经网络？

神经网络激活函数sigmoid relu tanh 为什么sigmoid 容易梯度消失

神经网络中为什么引入非线性激活函数？

卷积神经网络CNNs 为什么要用relu作为激活函数？

神经网络中的激活函数为什么都是平滑或近似平滑的？

图解通俗理解-神经网络为什么要引入激活函数

为什么卷积神经网络不是全连接，卷积，池化，激活，损失函数

【吴恩达深度学习专栏】浅层神经网络(Shallow neural networks)——为什么需要非线性激活函数？（why need a nonlinear activation function?）

神经网络激活函数

神经网络的激活函数

【神经网络】激活函数

keras中的神经网络为什么需要多次epoch

神经网络中的激活函数具体是什么？为什么ReLu要好过于tanh和sigmoid function?（转）

神经网络中的激活函数具体是什么？为什么Relu要好过与tanh和sigmoid function

神经网络激活函数的作用是什么

激活函数意义，什么样的函数可以作为激活函数，设计激活函数时需要考虑什么，常见激活函数及其优缺点和应用场景——从感知机到神经网络

为什么说神经网络可以逼近任意函数？

激活函数形象的解释神经网络激活函数的作用是什么？]

神经网络中常用的激活函数

神经网络之激活函数

神经网络的激活函数总结

神经网络中的激活函数

理解神经网络的激活函数

神经网络常用激活函数总结

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)