经典优化算法 - 代码天地

经典优化算法

其他 2019-11-24 15:34:13 阅读次数: 0

无约束优化算法

假设求解\(\min L(\theta)\)，\(L(\cdot)\)光滑

直接法

两个条件
- 函数是凸函数
- 一阶导数为零等式有闭式解

迭代法

假设优化问题为\(\begin{aligned} \delta_t = \mathop{\arg \min}_{\delta} L(\theta_t+\delta) \end{aligned}\)，其中\(\theta_t\)是参数

一阶法

对函数\(L(\theta_t+\delta)\)做一阶泰勒展开，得到近似式\(L(\theta_t+\delta) \approx L(\theta_t) + \nabla L(\theta)^T \delta\)
由于该近似式只有在\(\delta\)较小时才比较准确，因此在求解\(\delta_t\)时一般加上\(L_2\)正则项

\[\begin{aligned} \delta_t & = \mathop{\arg \min}_{\delta} \left( L(\theta_t) + \nabla L(\theta_t)^T\delta + \frac{1}{2\alpha}||\delta||^2_2 \right) \\ & = -\alpha \nabla L(\theta_t) \end{aligned}\]
一阶法的迭代公式为

\[\theta_{t+1} = \theta_t - \alpha \nabla L(\theta_t)\]
其中\(\alpha\)为学习率
也称为梯度下降法，梯度就是目标函数的一阶信息

二阶法

对函数\(L(\theta_t+\delta)\)做二阶泰勒展开，得到近似式\(L(\theta_t+\delta) \approx L(\theta_t) + \nabla L(\theta)^T \delta + \frac{1}{2}\delta^T \nabla ^2 L(\theta^T)\delta\)
其中\(\nabla^2 L(\theta_t)\)是函数在\(\theta_t\)处的Hessian矩阵。通过求解近似优化问题

\[\begin{aligned} \delta_t & = \mathop{\arg \min}_{\delta} \left( L(\theta_t) + \nabla L(\theta_t)^T\delta + \frac{1}{2}\delta^T \nabla ^2 L(\theta^T)\delta \right) \\ & = -\nabla^2 L(\theta_t)^{-1}\nabla L(\theta_t) \end{aligned}\]
二阶法的迭代公式为

\(\theta_{t+1} = \theta_t - \nabla^2 L(\theta)^{-1} \nabla L(\theta_t)\)
也称为牛顿法，Hessian矩阵就是目标函数的二阶信息
收敛速度快于一阶法，但在高维情况下，Hessian矩阵求逆计算复杂度很大
而且当目标函数非凸时，可能收敛到鞍点
改进：拟牛顿法，如BFGS算法

猜你喜欢

转载自www.cnblogs.com/weilonghu/p/11922492.html

经典优化算法

经典排序算法——快速排序及其优化

经典数值优化算法--专题学习

经典算法（1）：冒泡排序及其优化

Java:经典算法之冒泡排序(优化)

十大经典排序算法详解及优化

十大经典算法及其优化

Java求经典算法自由落体以及优化拓展

经典的同态滤波算法的优化及其应用参数配置。

超像素经典算法SLIC的代码的深度优化

算法讲解 -- 区间dp经典模型与优化（石子归并）

十大经典排序算法以及部分优化

Kmeans算法的经典优化——mini-batch和Kmeans++

十大经典排序算法解析及优化

经典排序算法之冒泡排序的优化方案

经典排序算法——冒泡排序及其优化（python代码实现）

经典PID控制算法原理以及优化思路

经典算法

算法——经典排序算法

【备注】SPFA经典优化

mysql的优化（经典必看）

经典排序算法的经典问题

无约束非线性优化经典算法学习笔记

算法与数据机构入门经典（基于数组的队列实现与优化）

实现经典 “四则运算” 算法优化 Redis 集合运算

经典算法 | 求两个排序好的数组中第k大的数优化方法

经典算法 | 在旋转数组中查找数字K最优化方法

动画+原理+代码+优化，解读十大经典排序算法

十大经典算法（一）：冒泡排序及其优化

前端面试题解密：经典算法之冒泡算法（ES6版）及优化

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)