1 基本性质和例子
1.1 凸函数
函数
则称为函数是凸的。
称函数
如果函数
1.2 扩展值延伸
通常我们可以定义凸函数在定义域外的值为
如果
延伸函数是定义在全空间
我们还可以从延伸函数
这样定义后,我们在描述不等式时就不需要限定定义域了。
比如对于上面的不等式,对于延伸函数,可以描述为:
对于任意
不引起歧义的情况下,以后将假设所有凸函数都被隐含的延伸了,不引起歧义的情况下,
1.3 一阶条件:
假设
1
2
一阶条件是充要条件。
对于严格凸函数的一阶条件,我们有:
1
2
对于
(图片来自斯坦福Boyd Convex Optimization)
如果函数
1.4 二阶条件:
假设函数
黑塞矩阵定义:
严格凸的条件可以部分由二阶条件刻画。
如果对于任意
例:二次函数
对于函数
对于二次函数,严格凸比较好表达,可以推出:
无论应用一阶条件还是二阶条件,都必须提前验证定义域是凸的:
对于函数
关于矩阵的求导运算,请参阅矩阵理论课程。这里给出简要的一点介绍。
1.5 矩阵求导
1) 矩阵对标量求导
相当于矩阵中每个元素对标量求导:
2) 标量对矩阵求导
注意与上面不同,这次括号内是求偏导,对
3) 函数矩阵
矩阵
其中:
重要结论:假设
4) 向量积对列向量
注意与标量有点不同,假设
5)重要结论
1.6 一些常见的例子
范数。
最大值函数是凸的,因为最大值函数可以看成是无穷维的范数。
范数是凸函数的证明可以直接用凸函数的定义加上三角不等式得出(简单的说,就是三角形两边之和大于第三边)。
二次线性分式函数
指数和的对数:
仿射函数既是凸函数,也是凹函数。
对于广义矩阵的乘法(仿射),对于
几何平均
1.7 凸函数的仿射定理
对于函数
我们用这个定理证明下以下结论:
对于方阵,行列式的乘积等于乘积的行列式。
矩阵的行列式还等于矩阵特征值的乘积。所以:
其中
所以,原函数是凸的。
1.8 下水平集和上镜图
函数的下水平集定义为:
下水平集是自变量的一个范围。一个凸函数的下水平集仍然是凸集,反之不成立。
函数的上镜图定义为:
上镜图是函数上方的一个范围。一个函数是凸函数,当且仅当其上镜图是凸集。
下图展示了上镜图的图片。
(图片来自斯坦福Boyd Convex Optimization)
(未完,待续)