UA MATH567 高维统计IV Lipschitz组合3 高斯分布的Lipschitz函数

UA MATH567 高维统计IV Lipschitz组合3 高斯分布的Lipschitz函数

首先我们在欧氏空间 ( R n , B ( R n ) ) (\mathbb{R}^n,\mathcal{B}(\mathbb{R}^n)) (Rn,B(Rn))上建立高斯概率测度 γ n \gamma_n γn,满足 ∀ B ∈ B ( R n ) \forall B \in \mathcal{B}(\mathbb{R}^n) BB(Rn)
γ n ( B ) = ∫ B 1 ( 2 π ) n / 2 e − ∥ x ∥ 2 2 2 d x \gamma_n(B) = \int_B \frac{1}{(2\pi)^{n/2}}e^{-\frac{\left\| x\right\|_2^2}{2}}dx γn(B)=B(2π)n/21e2x22dx

( R n , B ( R n ) , γ n ) (\mathbb{R}^n,\mathcal{B}(\mathbb{R}^n),\gamma_n) (Rn,B(Rn),γn)成为一个概率空间。

Gaussian Isoperimetric不等式 ∀ ϵ > 0 \forall \epsilon>0 ϵ>0 arg min ⁡ A ∈ B ( R n ) γ n ( A ϵ ) \argmin_{A \in \mathcal{B}(\mathbb{R}^n)} \gamma_n(A_{\epsilon}) AB(Rn)argminγn(Aϵ)是一个half space。这里半空间指的是
{ x = ( x 1 , ⋯   , x n ) ∈ R n : ∃ i ∈ { 1 , ⋯   , n } , x i ≤ c , c ∈ R } \{x = (x_1,\cdots,x_n) \in \mathbb{R}^n:\exists i \in \{1,\cdots,n\},x_i \le c,c \in \mathbb{R}\} { x=(x1,,xn)Rn:i{ 1,,n},xic,cR}

并且如果 γ n ( A ) ≥ 1 / 2 \gamma_n(A) \ge 1/2 γn(A)1/2,则 γ ( A t ) ≥ 1 − e − c t 2 , ∃ c > 0 \gamma(A_t) \ge 1-e^{-ct^2},\exists c>0 γ(At)1ect2,c>0

证明
我们简单讨论一下并且之后的一段。

H H H表示一个半空间:
{ x = ( x 1 , ⋯   , x n ) ∈ R n : x 1 ≤ 0 } \{x = (x_1,\cdots,x_n) \in \mathbb{R}^n:x_1\le 0\} { x=(x1,,xn)Rn:x10}

γ n ( H ) = 1 / 2 \gamma_n(H)=1/2 γn(H)=1/2,于是
γ n ( H t ) = P ( X ∈ H t ) = P ( X 1 ≤ t ) ≥ 1 − e − t 2 / 2 \gamma_n(H_t) = P(X \in H_t) = P(X_1 \le t) \ge 1-e^{-t^2/2} γn(Ht)=P(XHt)=P(X1t)1et2/2

这是标准正态分布的tail bound。如果 γ n ( A ) ≥ 1 / 2 \gamma_n(A) \ge 1/2 γn(A)1/2,显然
γ ( A t ) ≥ γ ( H t ) ≥ 1 − e − t 2 / 2 \gamma(A_t) \ge \gamma(H_t) \ge 1-e^{-t^2/2} γ(At)γ(Ht)1et2/2


Gaussian concentration不等式
X ∼ N ( 0 , I n ) X \sim N(0,I_n) XN(0,In) f : R n → R f:\mathbb{R}^n \to \mathbb{R} f:RnR是一个Lipschitz函数,则
∥ f ( X ) − E f ( X ) ∥ ψ 2 ≤ C ∥ f ∥ L i p \left\| f(X) - Ef(X) \right\|_{\psi_2} \le C \left\| f \right\|_{Lip} f(X)Ef(X)ψ2CfLip

证明
这个不等式的证明技术与上一讲的球面分布的Lipschitz函数一样,先说明 f ( X ) − M f(X)-M f(X)M是亚高斯的,然后用centering技巧得到结论。假设 ∥ f ∥ L i p = 1 \left\| f\right\|_{Lip}=1 fLip=1,不然我们总是可以分析 f / ∥ f ∥ L i p f/\left\| f\right\|_{Lip} f/fLip

第一步: f ( X ) − M f(X)-M f(X)M是亚高斯的,其中 M M M f ( X ) f(X) f(X)的中位数,也就是
P ( f ( X ) ≥ M ) ≥ 1 / 2 , P ( f ( X ) ≤ M ) ≥ 1 / 2 P(f(X) \ge M) \ge 1/2,P(f(X) \le M) \ge 1/2 P(f(X)M)1/2,P(f(X)M)1/2

定义
A = { x ∈ R n : f ( x ) ≤ M } A = \{x \in \mathbb{R}^n:f(x) \le M\} A={ xRn:f(x)M}


σ ( A ) = P ( X ∈ A ) = P ( f ( X ) ≤ M ) ≥ 1 / 2 \sigma(A) = P(X \in A) = P(f(X) \le M) \ge 1/2 σ(A)=P(XA)=P(f(X)M)1/2

根据Gaussian Isoperimetric不等式,
γ n ( A t ) ≥ 1 − e − t 2 / 2 \gamma_n(A_t) \ge 1-e^{-t^2/2} γn(At)1et2/2

因为 x ∈ A t x \in A_t xAt说明 ∃ y ∈ A \exists y \in A yA, ∥ x − y ∥ 2 ≤ t \left\| x-y \right\|_2 \le t xy2t,根据Lipschitz函数的定义:
f ( x ) − f ( y ) ≤ ∥ f ∥ L i p ∥ x − y ∥ 2 ≤ t f(x)-f(y) \le \left\| f \right\|_{Lip}\left\| x-y \right\|_2 \le t f(x)f(y)fLipxy2t

y ∈ A y \in A yA说明 f ( y ) ≤ M f(y) \le M f(y)M,所以
f ( x ) ≤ f ( y ) + t ≤ M + t f(x) \le f(y)+t \le M+t f(x)f(y)+tM+t

因此

P ( f ( X ) − M ≤ t ) ≥ P ( X ∈ A t ) = σ ( A t ) ≥ 1 − e − t 2 / 2 P(f(X)-M \le t) \ge P(X \in A_t)=\sigma(A_t) \ge 1-e^{-t^2/2} P(f(X)Mt)P(XAt)=σ(At)1et2/2

类似地,对于 f ( X ) − M ≥ − t f(X)-M \ge -t f(X)Mt,我们有
P ( f ( X ) − M ≥ − t ) ≥ 1 − e − t 2 / 2 P(f(X)-M \ge -t) \ge 1-e^{-t^2/2} P(f(X)Mt)1et2/2

所以
P ( ∣ f ( X ) − M ∣ ≥ t ) ≤ 2 e − t 2 / 2 P(|f(X)-M| \ge t) \le 2e^{-t^2/2} P(f(X)Mt)2et2/2

第二步:使用centering技巧,假设 X X X是亚高斯随机变量,则 X − E X X-EX XEX也是亚高斯随机变量,并且存在常数 C C C使得
∥ X − E X ∥ ψ 2 ≤ C ∥ X ∥ ψ 2 \left\| X-EX \right\|_{\psi_2} \le C\left\| X \right\|_{\psi_2} XEXψ2CXψ2

因为 f ( X ) − M f(X)-M f(X)M是亚高斯的,于是 f ( X ) − M − E [ f ( X ) − M ] = f ( X ) − E f ( X ) f(X)-M-E[f(X)-M]=f(X)-Ef(X) f(X)ME[f(X)M]=f(X)Ef(X)也是亚高斯的,证毕。

猜你喜欢

转载自blog.csdn.net/weixin_44207974/article/details/112167455