【Conic】最优性条件与对偶(1)

最优性条件

优化基本模型可以表示为
min ⁡ f ( x ) s . t . x ∈ F = C ∩ D (1) \begin{aligned} &\min & f(x)\\ &s.t. & x\in\mathcal{F}=\mathcal{C}\cap\mathcal{D} \end{aligned}\tag{1} mins.t.f(x)xF=CD(1)
Knapsack问题为例,该问题可以表示为
max ⁡ ∑ i = 1 n c i x i s . t . ∑ i = 1 n a i x i ≤ b x i ∈ { 0 , 1 } i = 1 , 2 , … , n \begin{aligned} \max &\sum_{i=1}^nc_ix_i\\ s.t.& \sum_{i=1}^na_ix_i\leq b\\ &x_i\in\{0, 1\}\quad i=1,2,\dots, n \end{aligned} maxs.t.i=1ncixii=1naixibxi{ 0,1}i=1,2,,n
可以等效表示为
C = { x ∈ R n ∣ ∑ i = 1 n a i x i ≤ b } , D = { 0 , 1 } n \mathcal{C}=\{x\in\mathbb{R}^n\mid\sum_{i=1}^na_ix_i\leq b\},\mathcal{D}=\{0, 1\}^n C={ xRni=1naixib},D={ 0,1}n
理想情况下,假设目标函数和约束函数均为光滑函数(可任意次微分且微分后的函数为连续)。
对于无约束优化问题,当 f ( x ) f(x) f(x) x ˉ \bar{x} xˉ点一阶连续可微的情况下,由Taylor expansion可以展开
f ( x ) = f ( x ˉ ) + ∇ f ( x ˉ ) T ( x − x ˉ ) + o ( ∥ x − x ˉ ∥ ) f(x)=f(\bar{x})+\nabla f(\bar{x})^T(x-\bar{x})+o(\|x-\bar{x}\|) f(x)=f(xˉ)+f(xˉ)T(xxˉ)+o(xxˉ)
定义 x ∈ F x\in\mathcal{F} xF的可行方向(feasible direction)集合为
D ( x ) = { d ∈ R n ∣ 存 在 δ 0 > 0 , 使 得 x + δ d ∈ F 对 所 有 0 < δ ≤ δ 0 均 成 立 } \mathcal{D}(x)=\{d\in\mathbb{R}^n\mid存在\delta_0>0,使得x+\delta d\in \mathcal{F}对所有0<\delta\leq\delta_0均成立\} D(x)={ dRnδ0>0,使x+δdF0<δδ0}

定理1

x ˉ ∈ F \bar{x}\in\mathcal{F} xˉF是优化问题 ( 1 ) (1) (1)的局部最优解的必要条件为:
∇ f ( x ˉ ) T d ≥ 0 ∀ d ∈ D ( x ˉ ) \nabla f(\bar{x})^Td\geq 0\quad \forall d\in\mathcal{D}(\bar{x}) f(xˉ)Td0dD(xˉ)

定理2

F \mathcal{F} F为非空凸集, f : R n f:\mathbb{R}^n f:Rn是凸函数,则 x ˉ ∈ F \bar{x}\in\mathcal{F} xˉF是问题 ( 1 ) (1) (1)的全局最优解的充分必要条件为
∇ f ( x ˉ ) T d ≥ 0 , ∀ d ∈ D ( x ˉ ) \nabla f(\bar{x})^Td\geq 0,\quad \forall d\in\mathcal{D}(\bar{x}) f(xˉ)Td0,dD(xˉ)

KKT条件

一般非线性规划模型为
min ⁡ f ( x ) s . t . g ( x ) ≤ 0 x ∈ R n (2) \begin{aligned} \min\quad & f(x)\\ s.t. \quad& g(x)\leq 0\\ &x\in\mathbb{R}^n \end{aligned}\tag{2} mins.t.f(x)g(x)0xRn(2)
定义 x ∈ F x\in\mathcal{F} xF的积极约束集(active constraint set)为
I = { i ∣ g i ( x ) = 0 } \mathcal{I}=\{i\mid g_i(x)=0\} I={ igi(x)=0}
设问题 ( 2 ) (2) (2)可行且所有约束函数在 R n \mathbb{R}^n Rn上连续可微,定义 x ∈ F x\in\mathcal{F} xF的积极约束的局部约束方向集(set of locally constrained directions)为
L ( x ) = { d ∈ R n ∣ ∇ g i ( x ) T d ≤ 0 , ∀ i ∈ I ( x ) } \mathcal{L}(x)=\{d\in\mathbb{R}^n\mid\nabla g_i(x)^Td\leq 0,\forall i\in\mathcal{I}(x)\} L(x)={ dRngi(x)Td0,iI(x)}
设问题 ( 2 ) (2) (2)的目标及所有约束函数在 R n \mathbb{R}^n Rn上连续可微和 x ˉ ∈ F \bar{x}\in\mathcal{F} xˉF为局部最优解,若 L ( x ˉ ) ⊆ c l ( c o n v ( D ( x ˉ ) ) ) \mathcal{L}(\bar{x})\subseteq cl(conv(D(\bar{x}))) L(xˉ)cl(conv(D(xˉ))),则存在 λ ˉ ∈ R + m \bar{\lambda}\in\mathbb{R}_+^m λˉR+m使得
∇ f ( x ˉ ) + ∑ i = 1 m λ ˉ i ∇ g i ( x ˉ ) = 0 λ ˉ i g i ( x ˉ ) = 0 i = 1 , 2 , … , m \begin{aligned} &\nabla f(\bar{x})+\sum_{i=1}^m\bar{\lambda}_i\nabla g_i(\bar{x})=0\\ &\bar{\lambda}_ig_i(\bar{x})=0\quad i=1,2,\dots, m \end{aligned} f(xˉ)+i=1mλˉigi(xˉ)=0λˉigi(xˉ)=0i=1,2,,m
KKT条件,满足KKT条件的点对 ( x , λ ) (x, \lambda) (x,λ)称为KKT点对,将x称为KKT点, λ i g i ( x ) = 0 \lambda_ig_i(x)=0 λigi(x)=0称为互补松弛条件。KKT条件的前提条件是约束规范(constriant qualification),即判断 L ( x ) ⊂ c l ( c o n v ( D ( x ) ) ) \mathcal{L}(x)\subset cl(conv(\mathcal{D}(x))) L(x)cl(conv(D(x)))是否满足。
对于无约束优化问题,设 x ˉ ∈ R n \bar{x}\in\mathbb{R}^n xˉRnKKT点且 f ( x ) f(x) f(x)在改点二阶可微,则其为局部最优解的必要条件为 ∇ 2 f ( x ˉ ) ∈ S + n \nabla^2f(\bar{x})\in\mathcal{S}_+^n 2f(xˉ)S+n,且 ∇ 2 f ( x ˉ ) ∈ S + + n \nabla^2f(\bar{x})\in\mathcal{S}_{++}^n 2f(xˉ)S++n x ˉ \bar{x} xˉ严格局部最优解的充分条件
无约束优化推广到约束优化时,需要考虑可行集合 F = { x ∈ R n ∣ g ( x ) ≤ 0 } \mathcal{F}=\{x\in\mathbb{R}^n\mid g(x)\leq 0\} F={ xRng(x)0},积极集 I ( x ) \mathcal{I}(x) I(x)以及局部约束方向集 L ( x ) \mathcal{L}(x) L(x)
f ( x ) f(x) f(x) g ( x ) g(x) g(x)都是二阶可微函数, ( x ˉ , λ ˉ ) (\bar{x}, \bar{\lambda}) (xˉ,λˉ)满足KKT条件且
L ( x , λ ) = f ( x ) + ∑ i = 1 m λ i g i ( x ) L(x, \lambda)=f(x)+\sum_{i=1}^m\lambda_ig_i(x) L(x,λ)=f(x)+i=1mλigi(x)
若关于 x x x变量的Hessian矩阵满足
d T ∇ x 2 L ( x ˉ , λ ˉ ) d > 0 ∀ d ∈ L ˉ ( x ˉ ) , d ≠ 0 d^T\nabla_x^2L(\bar{x}, \bar{\lambda})d>0\quad \forall d\in\bar{\mathcal{L}}(\bar{x}), d\neq 0 dTx2L(xˉ,λˉ)d>0dLˉ(xˉ),d=0

Slater约束规范

Slater约束规范(Slater's constraint qualification): { g i ( x ) , i ∈ I ( x ) } \{g_i(x), i\in\mathcal{I}(x)\} { gi(x),iI(x)}都是 R n \mathbb{R}^n Rn上的凸函数且存在一点 x 0 x_0 x0为严格内点,即 g i ( x 0 ) < 0 , i = 1 , 2 , … , m g_i(x_0)<0, i=1,2,\dots, m gi(x0)<0,i=1,2,,m.

Cotte约束规范

Cotte约束规范(Cotte's constraint qualification):存在一个方向 d d d使得 ∇ g i ( x ) T d < 0 , ∀ i ∈ I ( x ) \nabla g_i(x)^Td<0,\forall i\in\mathcal{I}(x) gi(x)Td<0,iI(x).

具有等式约束的优化问题

min ⁡ f ( x ) s . t . g i ( x ) ≤ 0 , i = 1 , 2 , … , m h j ( x ) = 0 , j = 1 , 2 , … , p (3) \begin{aligned} \min \quad& f(x)\\ s.t. \quad& g_i(x)\leq 0, i=1,2,\dots, m\\ &h_j(x)=0,j=1,2,\dots, p \end{aligned}\tag{3} mins.t.f(x)gi(x)0,i=1,2,,mhj(x)=0,j=1,2,,p(3)

线性独立约束规范

{ ∇ g i ( x ) , i ∈ I ( x ) ; ∇ h j ( x ) , j = 1 , 2 , … , p } \{\nabla g_i(x), i\in\mathcal{I}(x); \nabla h_j(x), j=1,2,\dots, p\} { gi(x),iI(x);hj(x),j=1,2,,p}线性无关

Slater约束规范

{ g i ( x ) , i ∈ I ( x ) } \{g_i(x), i\in \mathcal{I}(x)\} { gi(x),iI(x)}都是 R n \mathbb{R}^n Rn上的凸函数, { h j ( x ) , j = 1 , 2 , … , p } \{h_j(x), j=1,2,\dots, p\} { hj(x),j=1,2,,p}为线性函数,且存在一点 x 0 x_0 x0为相对内点,即 g i ( x 0 ) < 0 , i = 1 , 2 , … , m ; h j ( x 0 ) = 0 , j = 1 , 2 , … , p g_i(x_0)<0, i=1,2,\dots, m; h_j(x_0)=0, j=1,2,\dots, p gi(x0)<0,i=1,2,,m;hj(x0)=0,j=1,2,,p.

Lagrange对偶

建立Lagrange函数为
L ( x , λ ) = f ( x ) + ∑ i = 1 m λ i g i ( x ) L(x, \lambda)=f(x)+\sum_{i=1}^m \lambda_ig_i(x) L(x,λ)=f(x)+i=1mλigi(x)
其中 λ i \lambda_i λi为约束 g i ( x ) g_i(x) gi(x)对应的Lagrange乘子。

v p = min ⁡ x ∈ F f ( x ) = min ⁡ x ∈ R n max ⁡ λ ∈ R + m L ( x , λ ) v_p=\min_{x\in\mathcal{F}} f(x)=\min_{x\in\mathbb{R}^n}\max_{\lambda\in\mathbb{R}_+^m}L(x, \lambda) vp=xFminf(x)=xRnminλR+mmaxL(x,λ)
对于 λ ∈ R + m \lambda\in\mathbb{R}_+^m λR+m,有
v ( λ ) ≤ min ⁡ x ∈ F L ( x , λ ) ≤ min ⁡ x ∈ F f ( x ) v(\lambda)\leq\min_{x\in\mathcal{F}}L(x, \lambda)\leq\min_{x\in\mathcal{F}} f(x) v(λ)xFminL(x,λ)xFminf(x)
得到对偶问题
v d = max ⁡ λ ∈ R + m min ⁡ x ∈ R n L ( x , λ ) = max ⁡ λ ∈ R + m v ( λ ) v_d=\max_{\lambda\in\mathbb{R}_+^m}\min_{x\in\mathbb{R}^n}L(x, \lambda)=\max_{\lambda\in\mathbb{R}_+^m} v(\lambda) vd=λR+mmaxxRnminL(x,λ)=λR+mmaxv(λ)

弱对偶定理

对于问题 ( 2 ) (2) (2) v p ≥ v d v_p\geq v_d vpvd。由若对偶定理可知Lagrange对偶问题提供原问题的一个下界
对于给定的 λ ≥ 0 \lambda\geq 0 λ0,设 ( x , λ ) (x, \lambda) (x,λ)满足互补松弛条件 λ i g i ( x ) = 0 , i = 1 , 2 , … , m \lambda_ig_i(x)=0, i=1,2,\dots, m λigi(x)=0i=1,2,,m,当 x ∈ F x\in\mathcal{F} xF时, x x x为问题 ( 2 ) (2) (2)的最优解。
f ( x ) , g i ( x ) , i = 1 , 2 , … , m f(x), g_i(x),i=1,2,\dots, m f(x),gi(x),i=1,2,,m R n \mathbb{R}^n Rn上的凸函数, ( x , λ ) (x, \lambda) (x,λ)满足KKT条件,则 x x x为优化问题 ( 2 ) (2) (2)的全局最优解。

Demo

对于一个椭球约束的齐次二次规划问题
min ⁡ 1 2 x T A x s . t . 1 2 x T B x ≤ 1 x ∈ R n \begin{aligned} \min & \frac{1}{2}x^TAx\\ s.t.&\frac{1}{2}x^TBx\leq 1\\ &x\in\mathbb{R}^n \end{aligned} mins.t.21xTAx21xTBx1xRn
其中 A ∈ S n , B ∈ S + + n A\in\mathcal{S}^n, B\in\mathcal{S}_{++}^n ASn,BS++n
建立Lagrange函数
L ( x , λ ) = 1 2 x T A x + λ ( 1 2 x T B x − 1 ) = 1 2 x T ( A + λ B ) x − λ L(x, \lambda)=\frac{1}{2}x^TAx+\lambda(\frac{1}{2}x^TBx-1)=\frac{1}{2}x^T(A+\lambda B)x-\lambda L(x,λ)=21xTAx+λ(21xTBx1)=21xT(A+λB)xλ
计算对偶问题
max ⁡ λ ≥ 0 min ⁡ x ∈ R n 1 2 x T ( A + λ B ) x − λ = { max ⁡ λ ≥ 0 − λ A + λ B ∈ S + n − ∞ A + λ B ∉ S + n = max ⁡ λ ≥ 0 , A + λ B ∈ S + n − λ \begin{aligned} &\max_{\lambda\geq 0}\min_{x\in\mathbb{R}^n}\frac{1}{2}x^T(A+\lambda B)x-\lambda\\ &= \begin{cases} \max_{\lambda\geq 0}-\lambda & A+\lambda B\in\mathcal{S}_+^n\\ -\infty & A+\lambda B \notin \mathcal{S}_+^n \end{cases}\\ &=\max_{\lambda\geq 0, A+\lambda B\in\mathcal{S}_+^n} -\lambda \end{aligned} λ0maxxRnmin21xT(A+λB)xλ={ maxλ0λA+λBS+nA+λB/S+n=λ0,A+λBS+nmaxλ
该模型也是S-Lemma的结论。

参考文献

线性锥优化

猜你喜欢

转载自blog.csdn.net/qq_18822147/article/details/114358647