面试题：人工神经网络中为什么ReLu要好过于tanh和sigmoid？ - 代码天地

面试题：人工神经网络中为什么ReLu要好过于tanh和sigmoid？

编程语言 2021-03-26 11:13:09 阅读次数: 0

为什么ReLu要好过于tanh和sigmoid？

解析：先看sigmoid、tanh和RelU的函数图：

第一，采用sigmoid等函数，算激活函数时（指数运算），计算量大。

反向传播求误差梯度时，求导涉及除法和指数运算，计算量相对大，而采用Relu激活函数，整个过程的计算量节省很多。

第二，对于深层网络，sigmoid函数反向传播时，很容易就会出现梯度消失的情况（在sigmoid接近饱和区时，变换太缓慢，导数趋于0，这种情况会造成信息丢失。），这种现象称为饱和，从而无法完成深层网络的训练。

而ReLU就不会有饱和倾向，不会有特别小的梯度出现。

第三，Relu会使一部分神经元的输出为0，这样就造成了网络的稀疏性，并且减少了参数的相互依存关系，缓解了过拟合问题的发生（以及一些人的生物解释balabala）。

当然现在也有一些对relu的改进，比如prelu，random relu等，在不同的数据集上会有一些训练速度上或者准确率上的改进，具体的大家可以找相关的paper看。

多加一句，现在主流的做法，会多做一步batch normalization，尽可能保证每一层网络的输入具有相同的分布[1]。

而最新的paper[2]，他们在加入bypass connection之后，发现改变batch normalization的位置会有更好的效果。大家有兴趣可以看下。

[1] Ioffe S, Szegedy C. Batch normalization: Accelerating deep network training by reducing internal covariate shift[J]. arXiv preprint arXiv:1502.03167, 2015.

[2] He, Kaiming, et al. "Identity Mappings in Deep Residual Networks." arXiv preprint arXiv:1603.05027 (2016).
本题解析来源：@Begin Again，链接：https://www.zhihu.com/question/29021768

猜你喜欢

转载自blog.51cto.com/15057851/2672885

面试题：人工神经网络中为什么ReLu要好过于tanh和sigmoid？

人工神经网络中为什么ReLu要好过于tanh和sigmoid function？

深度学习——人工神经网络中为什么ReLu要好过于tanh和sigmoid function？

神经网络中的激活函数具体是什么？为什么ReLu要好过于tanh和sigmoid function?（转）

13.请问人工神经网络中为什么Relu要好过tanh和sigmoid

神经网络中的激活函数具体是什么？为什么Relu要好过与tanh和sigmoid function

神经网络激活函数sigmoid relu tanh 为什么sigmoid 容易梯度消失

神经网络中的激活函数sigmoid、 tanh 、RELU

神经网络中的激活函数-Sigmoid, ReLu, TanHyperbolic(tanh), softmax, softplus简述

机器学习笔记-神经网络中激活函数（activation function）对比--Sigmoid、ReLu，tanh

【卷积神经网络】12、激活函数 | Tanh / Sigmoid / ReLU / Leaky ReLU / ELU / SiLU / Mish

神经网络常用的三大激活函数sigmoid函数、tanh函数、relu函数对比讲解

【深度学习】——神经网络中常用的激活函数：sigmoid、Relu、Tanh函数

python绘制神经网络中的Sigmoid和Tanh激活函数图像(附代码)

AI面试题⑩--为什么必须在神经网络中引入非线性

浅层神经网络/深层神经网络的前向传播与反向传播计算过程、非线性的激活函数(Sigmoid、Tanh、Relu、Leaky ReLU)、参数与超参数

深度学习中的激活函数之 sigmoid、tanh和ReLU

pytorch中的 relu、sigmoid、tanh、softplus 函数

神经网络激活函数优缺点和比较（sigmod，tanh，relu，softmax，leaky relu，ELU,SELU）

sigmoid tanh Relu比较

深度学习面试题05：激活函数sigmod、tanh、ReLU、leaky Relu、Relu6

神经网络中sigmod函数和tanh函数的区别

PyTorch | 激活函数（Sigmoid、Tanh、ReLU和Leaky ReLU）

C++从零实现深度神经网络之六——实战手写数字识别（sigmoid和tanh）

激活函数-Sigmoid, Tanh及ReLU

激活函数 sigmoid、tanh、relu

激活函数 sigmoid，tanh，relu

人工智能--神经网络各大公司面试题（2018）

激活函数的比较和优缺点，sigmoid，tanh，relu，softmax

python 画sigmoid、tanh、relu和ELU等激活函数

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)