LR为什么不可以用MSE作为损失函数 - 代码天地

LR为什么不可以用MSE作为损失函数

其他 2021-03-27 20:23:16 阅读次数: 0

原因总结：

MSE 会有梯度消失现象
MSE 的导数非凸函数，求解最优解困难

证明：

1. 梯度消失公式证明：

令 $f(x)=\theta x+b$ ，记为 $s$ 。

只关注其中单项的公式，并简化可得：

可见，当 h 趋近于 0 时或者趋近于 1 时，该 Loss 的导数都会趋近为 0，从而造成梯度消失现象。

2. 非凸函数公式证明

关注 $L{}'(\theta)$ 其二阶导数，可以得出其二阶导数矩阵即 Hessian 矩阵不是正定矩阵。该导数是非凸函数，不是凸函数，难以优化。

h(1-h) 在(0,1)内都大于 0，假设 y=0 时， $L{}''(\theta)$ 则由 $3h^2-2h$ 决定。
因为 $3h^2-2h$ 的根为0, $\frac{2}{3}$ , 即其在 [0,1] 范围内有正有负。从而得出 $L{}''(\theta)$ 有正有负，即为非凸函数。

参考：https://www.jianshu.com/p/af1e5cff21b9

猜你喜欢

转载自blog.csdn.net/Matrix_cc/article/details/105610513

LR为什么不可以用MSE作为损失函数

C++为什么不可以同时用const和static修饰成员函数

string 为什么不可以改变

Ubuntu vi 方向键不可以用

electron 关于jquery不可以用

哈希索引为什么不可以作为Mysql的索引？

c++中为什么函数定义可以在主函数后面而类的定义不可以？

vector 为什么不可以直接用cin插入的故事

C语言函数为什么不可以声明默认参数？

在JAVASCRIPT中，为什么document.getElementById不可以再全局（函数外）使用？

【机器学习算法】为什么交叉熵可以用作逻辑回归(分类模型)的损失函数 ?

为什么C++的构造函数不可以是虚函数，而析构函数可以是虚函数

析构函数可以调用虚函数，构造函数为什么不可以调用虚函数

java中变化的数据为什么不可以压缩

列表渲染为什么需要key？可以用index作为key吗？

MarkdownPad2预览功能不可以用解决方法！

PageHelper.startPage（）分页时查询字段去重时不可以用DISTINCT

LD_LIBRARY_PATH 修改后导致段错误不可以用

chatGPT中文版入口-chatGPT不可以用的地区

webstrom中输 node -v命令不可以用

为什么交叉熵可以作为机器学习和深度学习的损失函数？

为什么定积分可以用原函数来计算？

那些函数不可以作为虚函数呢？了解一下。

java接口的意义，为什么接口可以多继承，而类不可以？

神经网络模型为什么要分层?可以不可以打破层次结构？

HashMap的key和value可以为空，ConcurrentHashMap和HashTable不可以，为什么

为什么 Eslint 可以检查和修复格式问题，而 Babel 不可以？

为什么Java接口可以多继承，而类不可以？

Bootstrap-table中请求服务端数据POST不可以用解决方法

为什么可以用Object.assign触发$watch

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)