凸优化理论(2)

上篇博客开始了我的凸优化之旅,介绍了凸集和凸函数的定义,这篇博客给出凸函数非常有用的性质和判别条件,并给出其数学证明,同时给出强凸函数定义。

首先勘误一下上篇博客关于严格凸的定义,其条件不是 λ [ 0 , 1 ] \lambda \in [0,1] ,而是 λ ( 0 , 1 ) \lambda \in (0,1)
1、性质1:局部最优就是全局最优
证明: 利用反证法进行证明,假设 f ( x ) f(x^*) 为找到的一个局部最小值,假设还存在一个 f ( x n ) f(x_n) 更小,即
f ( x ) > f ( x n ) f(x^*)>f(x_n)
则在凸集 S S 上,由凸函数定义有
f ( x + λ ( x n x ) ) λ f ( x n ) + ( 1 λ ) f ( x ) f(x^*+\lambda (x_n-x^*))\leq \lambda f(x_n)+(1-\lambda)f(x^*)
其中 λ [ 0 , 1 ] \lambda \in [0,1] ,如果令 λ \lambda 不为0,则 f ( x + λ ( x n x ) ) < f ( x ) f(x^*+\lambda (x_n-x^*))<f(x^*) ,显然可以很轻松地找到合适的 λ \lambda 使得 x + λ ( x n x ) x^*+\lambda (x_n-x^*) 非常靠近 x x^* ,这将与 f ( x ) f(x^*) 是局部最小相矛盾。

2、性质2:一阶条件,设 f ( x ) f(x) 在凸集 S S 上具有一阶连续偏导,则 f ( x ) f(x) S S 上的凸函数的充要条件为
x 1 , x 2 S , f ( x 2 ) f ( x 1 ) + f ( x 1 ) T ( x 2 x 1 ) \forall x_1,x_2\in S , f(x_2)\geq f(x_1)+\triangledown f(x_1)^T(x_2-x_1)
证明:
(1) 首先考虑一元函数情形
充分性: 由凸函数定义有 f ( x 1 + λ ( x 2 x 1 ) ) λ f ( x 2 ) + ( 1 λ ) f ( x 1 ) f(x_1+\lambda (x_2-x_1)) \leq \lambda f(x_2)+(1-\lambda)f(x_1)
假设 λ ( 0 , 1 ] \lambda \in (0,1] ,则不等式2边同除 λ \lambda ,得
f ( x 2 ) f ( x 1 ) + f ( x 1 + λ ( x 2 x 1 ) ) f ( x 1 ) λ f(x_2)\geq f(x_1)+\frac{f(x_1+\lambda (x_2-x_1))-f(x_1)}{\lambda}
λ \lambda 趋近于0即可得 f ( x 2 ) f ( x 1 ) + f ( x 1 ) ( x 2 x 1 ) f(x_2)\geq f(x_1)+f'(x_1)(x_2-x_1)

必要性: 取 z = λ x 1 + ( 1 λ ) x 2 z=\lambda x_1+(1-\lambda) x_2 ,则
f ( x 1 ) f ( z ) + f ( z ) ( x 1 z ) f(x_1)\geq f(z)+f'(z)(x_1-z)
f ( x 2 ) f ( z ) + f ( z ) ( x 2 z ) f(x_2)\geq f(z)+f'(z)(x_2-z)
上述2式分别乘以 λ \lambda 1 λ 1-\lambda 则可得 f ( z ) λ f ( x 1 ) + ( 1 λ ) f ( x 2 ) f(z)\leq \lambda f(x_1) + (1-\lambda)f(x_2)

多元函数的证明与一元函数思路类似。
3、性质3:二阶条件,设函数 f ( x ) f(x) 在开凸集 S S 上具有二阶连续偏导, f ( x ) f(x) 为凸函数的充要条件是函数的 H e s s i a n Hessian 矩阵在 S S 上处处半正定。
二阶判别条件的证明留作下篇给出。

发布了9 篇原创文章 · 获赞 4 · 访问量 2807

猜你喜欢

转载自blog.csdn.net/weixin_43198281/article/details/89762932
今日推荐