UA MATH567 高维统计III 随机矩阵6 亚高斯矩阵的范数

在前五讲的理论基础上，我们现在开始正式讨论随机矩阵。假设 $A$ 是一个 $\times n$ 的随机矩阵，它的元素 $A_{ij}$ 是互相独立的零均值的亚高斯随机变量，关于它的范数有下面的结论

随机矩阵的范数 $K=\max_{i,j}\left\| A_{ij} \right\|_{\psi_2}$ , $\forall t>0$
$P(\left\| A\right\| \lesssim K(\sqrt{m}+\sqrt{n}+t)) \ge 1-2e^{-t^2}$

这个结果说明矩阵 $A$ 的范数的尾部概率也具有亚高斯性。如果 $A$ 是 $\times n$ 的对称阵，则
$P(\left\| A\right\| \lesssim K(\sqrt{n}+t)) \ge 1-4e^{-t^2}$

证明

第一步，我们先考虑一下算子范数，
$\left\| A \right\| = \max_{x \in S^{n-1} \\ y \in S^{m-1}}\langle Ax,y\rangle$

存在 $\in S^{n-1},y \in S^{m-1}$ 使得 $\left\| A \right\|=\langle Ax,y\rangle$ ，假设 $\mathcal{N}$ 是 $S^{n-1}$ 的一个 $\epsilon$ -net（根据第四讲的讨论，我们总是可以用一个球框住这样的集网，因此不失一般性，我们可以构造cardinality满足 $|\mathcal{N}|<9^n,|\mathcal{M}|<9^m$ 的集网）， $\mathcal{M}$ 是 $S^{m-1}$ 的一个 $\epsilon$ -net，则根据定义 $\exists x_0 \in \mathcal{N},\exists y_0 \in \mathcal{M}$ ， $\left\| x-x_0\right\|_2 \le \epsilon,\left\| y-y_0\right\|_2 \le \epsilon$ ，计算
$\langle Ax_0,y_0\rangle=\langle Ax,y\rangle+\langle A(x-x_0),y\rangle+\langle Ax_0,y_0-y\rangle$

类似地，第三项满足
$\langle Ax_0,y_0-y\rangle \ge -\epsilon \left\| A \right\|$

因此
$\left\| A \right\| \le \frac{1}{1-2\epsilon}\langle Ax_0,y_0\rangle \le \frac{1}{1-2\epsilon}\max_{x \in \mathcal{N} \\ y \in \mathcal{M}}\langle Ax,y\rangle$

第二步，我们讨论随机矩阵的二次型， $\forall x \in \mathcal{N}, y \in \mathcal{M}$ ，
$\langle Ax,y\rangle=\sum_{i=1}^n \sum_{j=1}^m A_{ij}x_ix_j$

于是根据推广Hoeffding不等式的第一个结论， $\exists C>0$ ，
$\left\| \langle Ax,y\rangle\right\|_{\psi_2} \le C \sum_{i=1}^n \sum_{j=1}^m \left\| A_{ij}x_ix_j\right\|_{\psi_2} \\ = C \sum_{i=1}^n \sum_{j=1}^mx_i^2y_j^2 \left\| A_{ij}\right\|_{\psi_2} \le C \sum_{i=1}^n \sum_{j=1}^mx_i^2y_j^2 K^2 = CK^2$

这说明 $\langle Ax,y\rangle$ 是亚高斯的。

第三步，使用亚高斯性，
$P(\langle Ax,y\rangle \ge u) \le 2 e^{-cu^2/K^2},\exists c>0$

于是
$P(\max_{x \in \mathcal{N} \\ y \in \mathcal{M}}\langle Ax,y\rangle \ge u) \le \sum_{x \in \mathcal{N} \\ y \in \mathcal{M}} P(\langle Ax,y\rangle \ge u) \\ \le 9^{m+n}2 e^{-cu^2/K^2}=2e^{(m+n)\log 9-cu^2/K^2}$

因为 $u$ 可以任意选取，为了使这个尾部概率尽可能小，我们希望通过选取 $u$ 使得这个概率的上界在 $m, n$ 趋于无穷时收敛到0，一种可行的选取是
$C'K(\sqrt{m}+\sqrt{n}+t) \\ u^2 \ge C'^2K^2(m+n+t)$

其中 $C^{'} > 0$ 是个常数，于是
$2e^{(m+n)\log 9-cu^2/K^2} \ge 2e^{(m+n)\log 9-cC'^2(m+n)-cC'^2t}$

选取 $C^{'}$ 使得
$(m+n)\log 9-cC'^2(m+n)<0,cC'^2 \ge 1$

则
$2e^{(m+n)\log 9-cC'^2(m+n)-cC'^2t} \ge 2e^{-2t^2}$

这样我们就说明了 $\exists C>0$
$P(\left\| A\right\| \le C K(\sqrt{m}+\sqrt{n}+t)) \ge 1-2e^{-t^2}$

第四步，说明对称的情况，如果 $A^T=A$ ，我们是不能直接用第三步的结果的，因为前三步得到的结论要求 $A$ 的所有分量都是独立的，而对称的矩阵自带约束 $A_{ij}=A_{ji}$ ，因此关于主对角线对称的两个元素必定不独立。一种拆分方法是我们把对称矩阵沿主对角线拆开：
$A=A^+ + A^-$

分别对 $\left\| A^+\right\|$ 与 $\left\| A^-\right\|$ 使用前三步的结论即可。

UA MATH567 高维统计III 随机矩阵6 亚高斯矩阵的范数

UA MATH567 高维统计III 随机矩阵6 亚高斯矩阵的范数

猜你喜欢