UA MATH567 高维统计IV Lipschitz组合9 矩阵函数、半正定序与迹不等式

UA MATH567 高维统计IV Lipschitz组合9 矩阵函数、半正定序与迹不等式

这一讲的目标是提供一些矩阵分析的工具,因为下一讲我们要尝试导出随机矩阵的Bernstein不等式。

矩阵函数

假设 X X X是对称矩阵,则 X X X的所有特征值都是实数,我们可以写出 X X X的谱分解为
X = ∑ i = 1 n λ i u i u i T X = \sum_{i=1}^n \lambda_i u_iu_i^T X=i=1nλiuiuiT

其中 λ i \lambda_i λi是特征值, u i u_i ui是对应的特征向量,假设 f f f是一个实函数,则我们定义矩阵函数为
f ( X ) = ∑ i = 1 n f ( λ i ) u i u i T f(X) = \sum_{i=1}^n f(\lambda_i)u_iu_i^T f(X)=i=1nf(λi)uiuiT

例 多项式与幂级数
i)称 f ( X ) f(X) f(X)为矩阵多项式如果
f ( x ) = ∑ i = 0 p a i x i , ∀ x ∈ R f(x) = \sum_{i=0}^p a_ix^i,\forall x \in \mathbb{R} f(x)=i=0paixi,xR


f ( X ) = ∑ j = 1 m ∑ i = 0 p a i λ j i u i u i T = ∑ i = 0 p a i X i f(X) =\sum_{j=1}^m \sum_{i=0}^pa_i \lambda_j^i u_iu_i^T = \sum_{i=0}^p a_iX^i f(X)=j=1mi=0paiλjiuiuiT=i=0paiXi

ii)称 f ( X ) f(X) f(X)为矩阵的指数函数如果 f ( x ) = e x f(x)=e^x f(x)=ex,则
f ( X ) = ∑ i = 1 m e λ i u i u i T = e X f(X)=\sum_{i=1}^m e^{\lambda_i}u_iu_i^T = e^X f(X)=i=1meλiuiuiT=eX

iii)对一般的解析函数,我们通常不能直接把它的表达式套用到矩阵上,而是只能用它的幂级数来表示,如果
f ( x ) = ∑ i = 0 ∞ a i ( x − x 0 ) i f(x) = \sum_{i=0}^{\infty} a_i(x-x_0)^i f(x)=i=0ai(xx0)i


f ( X ) = ∑ j = 1 m f ( λ j ) u j u j T = ∑ i = 0 ∞ a i ( X − x 0 I n ) i f(X) = \sum_{j=1}^m f(\lambda_j)u_ju_j^T = \sum_{i=0}^{\infty} a_i(X-x_0I_n)^i f(X)=j=1mf(λj)ujujT=i=0ai(Xx0In)i

半正定序(positive semi-definite order, PSD order)

X ≽ 0 X \succcurlyeq 0 X0,如果 X X X是半正定矩阵(也就是 λ i ( X ) ≥ 0 \lambda_i(X) \ge 0 λi(X)0),称 X ≽ Y X \succcurlyeq Y XY如果 X − Y X-Y XY是半正定矩阵;这个序关系被称为半正定序,它是一个偏序关系。关于半正定序有下面的结论:

在这里插入图片描述

迹不等式

迹不等式在研究随机矩阵的概率不等式时非常有用,最主要的原因就是矩阵的乘法不满足交换律,以Hoeffding不等式的证明为例,对于随机变量,我们有
e x + y = e x e y e^{x+y} = e^x e^y ex+y=exey

于是我们可以把一列随机变量拆分称指数的积或者合并到指数上的和,但对于随机矩阵而言 e X + Y = e X e Y e^{X+Y}=e^Xe^Y eX+Y=eXeY不一定成立,所以我们需要能代替乘法交换律的工具,最容易想到的当然就是矩阵的迹了,因为在迹中做矩阵乘法是可以交换次序的,下面介绍两个常用的迹不等式:

Golden-Thompson不等式 A , B A,B A,B是两个 n n n阶对称实矩阵,则
t r ( e A + B ) ≤ t r ( e A e B ) tr(e^{A+B}) \le tr(e^Ae^B) tr(eA+B)tr(eAeB)

Lieb不等式 假设 H H H n n n阶对称实矩阵,定义
f ( X ) = t r ( e H + log ⁡ X ) f(X) = tr(e^{H+\log X}) f(X)=tr(eH+logX)

f ( X ) f(X) f(X) n n n阶对称实正定矩阵空间(这是一个convex cone)上的concave function,根据Jensen不等式
E f ( X ) ≤ f ( E X ) E t r ( e H + log ⁡ X ) ≤ t r ( e H + log ⁡ E X ) Z = log ⁡ X , 则 E t r ( e H + Z ) ≤ t r ( e H + log ⁡ E e Z ) Ef(X) \le f(EX) \\ Etr(e^{H+\log X}) \le tr(e^{H+\log EX}) \\ Z = \log X,则Etr(e^{H+Z}) \le tr(e^{H+\log Ee^Z}) Ef(X)f(EX)Etr(eH+logX)tr(eH+logEX)Z=logX,Etr(eH+Z)tr(eH+logEeZ)

猜你喜欢

转载自blog.csdn.net/weixin_44207974/article/details/112211519