矩阵分析与应用-1.3-随机向量

前言

本文学习过程来源是《矩阵分析与应用-张贤达》一书. 可以通过 z-lib 下载.

这部分将线代和概率两者之间结合起来, 使用矩阵来解决概率方面的问题.

在概率论中, 用符号 ω ( ω ∈ Ω ) \omega(\omega \in \Omega) ω(ωΩ) 代表基本事件, A ( ∈ F ) A(\in \mathcal{F}) A(F) 为事件, F \mathcal{F} F 是事件的全部, P ( A ) P(A) P(A) 称为事件的概率.

在概率空间 ( Ω , F , P ) (\Omega,\mathcal{F},P) (Ω,F,P). 用 L p = L p ( Ω , F , P ) L_p=L_p(\Omega,\mathcal{F},P) Lp=Lp(Ω,F,P) 表示随机变量 ξ = ξ ( ω ) \xi = \xi(\omega) ξ=ξ(ω) 的空间. 其中 E { ∣ ξ ∣ p d p < ∞ } E \left \{ |\xi|^pdp < \infty \right \} E{ ξpdp<}, 称 L p ( p > 1 ) L_p(p>1) Lp(p>1) B a n a c h Banach Banach 空间.

B a n a c h Banach Banach 空间中, 有用的是空间 L 2 = L 2 ( Ω , F , P ) L_2 = L_2(\Omega,\mathcal{F},P) L2=L2(Ω,F,P). 这种空间就是具有有限二阶矩 E { ∣ ξ ∣ 2 } < ∞ E\left \{ |\xi|^2 \right \} < \infty E{ ξ2}< 的随机变量的 H i l b e r t Hilbert Hilbert 空间, 简称为 L 2 L_2 L2 空间. 由此衍生出 L 2 L_2 L2 理论用于研究向量空间中一阶和二阶统计性质, 解决一维和二维的问题.

一、概率密度函数

描述随机向量的统计函数有累计分布函数, 概率密度函数, 均值函数, 协方差函数.

先解决累计分布函数和概率密度函数.

1. 实随机变量的概率密度函数

现在有一个含有 m m m 个随机变量的实值向量

x ( ξ ) = [ x 1 ( ξ ) , x 2 ( ξ ) , … , x m ( ξ ) ] T x(\xi) = [x_1(\xi),x_2(\xi),\dots,x_m(\xi)]^{\mathrm{T}} x(ξ)=[x1(ξ),x2(ξ),,xm(ξ)]T

称为 m × 1 m \times 1 m×1 实随机向量, 或者简称随机向量(当维数无关紧要时). 式子中的 ξ \xi ξ 表示样本点, 例如它可以是时间 t t t , 角频率 ω \omega ω 或位置 s s s 等.

一个随机向量所有元素的联合累积分布函数常用符号 F x ( x 1 , x 2 , … , x m ) F_x(x_1,x_2,\dots,x_m) Fx(x1,x2,,xm) 表示, 联合概率密度函数常用 f x ( x 1 , x 2 , … , x m ) f_x(x_1,x_2,\dots,x_m) fx(x1,x2,,xm) 表示. 令 F ( x ) = F x ( x 1 , x 2 , … , x m ) F(x) = F_x(x_1,x_2,\dots,x_m) F(x)=Fx(x1,x2,,xm) f ( x ) = f x ( x 1 , x 2 , … , x m ) f(x) = f_x(x_1,x_2,\dots,x_m) f(x)=fx(x1,x2,,xm).

一个随机向量由它的2联合累积分布函数或联合概率密度函数完全描述, 一组概率的集合函数

F ( x ) = d e f P { ξ : x 1 ( ξ ) ≤ x 1 , x 2 ( ξ ) ≤ x 2 , … , x m ( ξ ) ≤ x m } F(x) \overset{def}{=} P \left \{ \xi : x_1(\xi) \le x_1,x_2(\xi) \le x_2,\dots,x_m(\xi) \le x_m\right \} F(x)=defP{ ξ:x1(ξ)x1,x2(ξ)x2,,xm(ξ)xm}

定义为向量 x ξ x_{\xi} xξ 的联合累积分布函数, 简称分布函数, 式中 x i x_i xi 为实数.

随机向量 x ( ξ ) x(\xi) x(ξ) 的(联合)概率密度函数定义为:

f ( x ) = d e f lim ⁡ Δ x 1 → 0 , … , Δ x m → 0 P { ξ : x 1 < x 1 ( ξ ) ≤ x 1 + Δ x 1 , … , x m < x m ( ξ ) ≤ x m + Δ x m } Δ x 1 … Δ x m = ∂ m ∂ x 1 ∂ x 2 … ∂ x m F x ( x 1 , x 2 , … , x m ) \begin{aligned} f(x) & \overset{def}{=} \lim_{\Delta x_1 \to 0,\dots,\Delta x_m \to 0} \frac{P \left \{ \xi : x_1 < x_1(\xi) \le x_1 + \Delta x_1,\dots,x_m < x_m(\xi) \le x_m + \Delta x_m \right \}}{\Delta x_1 \dots \Delta x_m}\\ &= \frac{\partial^m}{\partial x_1 \partial x_2 \dots \partial x_m}F_x(x_1,x_2,\dots,x_m) \end{aligned} f(x)=defΔx10,,Δxm0limΔx1ΔxmP{ ξ:x1<x1(ξ)x1+Δx1,,xm<xm(ξ)xm+Δxm}=x1x2xmmFx(x1,x2,,xm)

思考: 这个式子看起来非常的奇怪, 怪就怪在有了多个变量之后分母变得奇怪, 第一个等式后的分母中我也不知道为什么会有这些数相乘. 也可以这样想, 各个变量之间相互独立就可以拆开为乘积的形式, 然后能理解了.

P { ξ : x 1 < x 1 ( ξ ) ≤ x 1 + Δ x 1 } Δ x 1 … P { ξ : x m < x m ( ξ ) ≤ x m + Δ x 1 } Δ x m \frac{P \left \{ \xi : x_1 < x_1(\xi) \le x_1 + \Delta x_1 \right \}}{\Delta x_1} \dots \frac{P \left \{ \xi : x_m < x_m(\xi) \le x_m + \Delta x_1 \right \}}{\Delta x_m} Δx1P{ ξ:x1<x1(ξ)x1+Δx1}ΔxmP{ ξ:xm<xm(ξ)xm+Δx1}

联合概率密度函数的 m − 1 m - 1 m1 重积分函数

f ( x i ) = d e f ∫ − ∞ ∞  ⁣ ⋯ ∫ − ∞ ∞ f x ( x 1 , x 2 , … , x m ) d x 1 … d x i − 1 d x i + 1 … d x m f(x_i) \overset{def}{=} \int_{-\infty}^{\infty} \dots \int_{-\infty}^{\infty} f_x(x_1,x_2,\dots,x_m)dx_1 \dots dx_{i-1}dx_{i+1} \dots dx_m f(xi)=deffx(x1,x2,,xm)dx1dxi1dxi+1dxm

称为随机变量 x i x_i xi 的边缘概率密度函数.

最后就得到式子

F ( x ) = ∫ − ∞ x 1  ⁣ ⋯ ∫ − ∞ x m f v ( v 1 , v 2 , … , v m ) d v 1 … d v m F(x) = \int_{-\infty}^{x_1} \dots \int_{-\infty}^{x_m} f_v(v_1,v_2,\dots,v_m)dv_1 \dots dv_m F(x)=x1xmfv(v1,v2,,vm)dv1dvm

随机向量 x ( ξ ) x(\xi) x(ξ) 的联合分布函数等于其联合概率密度函数的积分.

由此有个定义, 这个定义就是之前思考那个式子想出的东西.

随机变量 x 1 ( ξ ) , x 2 ( ξ ) , … , x m ( ξ ) x_1(\xi), x_2(\xi) , \dots , x_m(\xi) x1(ξ),x2(ξ),,xm(ξ) 称为 (联合) 独立, 若对于 m m m 个事件 { x 1 ( ξ ) ≤ x 1 } , { x 2 ( ξ ) ≤ x 2 } , … , { x m ( ξ ) ≤ x m } \left \{ x_1(\xi) \le x_1 \right \},\left \{ x_2(\xi) \le x_2 \right \},\dots,\left \{ x_m(\xi) \le x_m \right \} { x1(ξ)x1},{ x2(ξ)x2},,{ xm(ξ)xm}, 有概率关系

P { x 1 ( ξ ) ≤ x 1 , … , x m ( ξ ) ≤ x m } = P { x 1 ( ξ ) ≤ x 1 } … P { x m ( ξ ) ≤ x m } P \left \{x_1(\xi) \le x_1,\dots,x_m(\xi) \le x_m\right \} = P\left \{x_1(\xi) \le x_1 \right \} \dots P\left \{x_m(\xi) \le x_m \right \} P{ x1(ξ)x1,,xm(ξ)xm}=P{ x1(ξ)x1}P{ xm(ξ)xm}

成立. 然后可以得出

F ( x ) = F x ( x − 1 , x 2 , … , x m ) = F x 1 ( x 1 ) F x 2 ( x 2 ) … F x m ( x m ) F(x) = F_x(x-1,x_2,\dots,x_m) = F_{x_1}(x_1)F_{x_2}(x_2) \dots F_{x_m}(x_m) F(x)=Fx(x1,x2,,xm)=Fx1(x1)Fx2(x2)Fxm(xm)

或者

f ( x ) = f x ( x − 1 , x 2 , … , x m ) = f x 1 ( x 1 ) f x 2 ( x 2 ) … f x m ( x m ) f(x) = f_x(x-1,x_2,\dots,x_m) = f_{x_1}(x_1)f_{x_2}(x_2) \dots f_{x_m}(x_m) f(x)=fx(x1,x2,,xm)=fx1(x1)fx2(x2)fxm(xm)

定义: m m m 个随机变量的联合分布函数 (或联合概率密度函数) 等于各个随机变量的边缘分布函数 (或边缘概率密度函数) 之积, 则这 m m m 个随机变量是联合独立的, 被称为统计独立.

2. 复随机变量的概率密度函数

处理复数就是要额外处理它的虚部, 首先一个复随机变量定义为 x ( ξ ) = x R ( ξ ) + j x I ( ξ ) x(\xi) = x_R(\xi) + jx_I(\xi) x(ξ)=xR(ξ)+jxI(ξ), 其中 x R ( ξ ) x_R(\xi) xR(ξ) x I ( ξ ) x_I(\xi) xI(ξ) 分别为实值随机变量.

那么复随机向量可以表示为

x ( ξ ) = x R ( ξ ) + j x I ( ξ ) = [ x R 1 ( ξ ) x R 2 ( ξ ) ⋮ x R m ( ξ ) ] + j [ x I 1 ( ξ ) x I 2 ( ξ ) ⋮ x I m ( ξ ) ] x(\xi) = x_R(\xi) + jx_I(\xi) = \begin{bmatrix} x_{R1}(\xi) \\ x_{R2}(\xi) \\ \vdots \\ x_{Rm}(\xi) \end{bmatrix} + j\begin{bmatrix} x_{I1}(\xi) \\ x_{I2}(\xi) \\ \vdots \\ x_{Im}(\xi) \end{bmatrix} x(ξ)=xR(ξ)+jxI(ξ)=xR1(ξ)xR2(ξ)xRm(ξ)+jxI1(ξ)xI2(ξ)xIm(ξ)

复随机向量的累积分布函数定义为

F ( x ) = d e f P { x ( ξ ) ≤ x } = d e f P { x R ( ξ ) ≤ x R , x I ( ξ ) ≤ x I } F(x) \overset{def}{=} P \left \{ x(\xi) \le x \right \} \overset{def}{=} P \left \{ x_R(\xi) \le x_R, x_I(\xi) \le x_I \right \} F(x)=defP{ x(ξ)x}=defP{ xR(ξ)xR,xI(ξ)xI}

无非就是对实部和虚部分别处理.

概率密度函数定义为

f ( x ) = d e f ∂ 2 m F ( x ) ∂ x R 1 ∂ x I 1 … ∂ x R m ∂ x I m f(x) \overset{def}{=} \frac{\partial^{2m}F(x)}{\partial x_{R1} \partial x_{I1} \dots \partial x_{Rm} \partial x_{Im}} f(x)=defxR1xI1xRmxIm2mF(x)

那么累积分布函数是概率密度函数关于所有实部和虚部的 2 m 2m 2m 重积分.

F ( x ) = F x ( x 1 , x 2 , … , x m ) = ∫ − ∞ x R 1 ∫ − ∞ x I 1  ⁣ ⋯ ∫ − ∞ x R m ∫ − ∞ x I m f ( v 1 , … , v m ) d v R 1 d v I 1 … d v R m d v I m = ∫ − ∞ x f ( v ) d v \begin{aligned} F(x) & = F_x(x_1,x_2,\dots,x_m)\\ &= \int_{-\infty}^{x_{R1}} \int_{-\infty}^{x_{I1}} \dots \int_{-\infty}^{x_{Rm}} \int_{-\infty}^{x_{Im}} f(v_1,\dots,v_m)dv_{R1}dv_{I1} \dots dv_{Rm}dv_{Im} &= \int_{-\infty}^{x} f(v)dv \end{aligned} F(x)=Fx(x1,x2,,xm)=xR1xI1xRmxImf(v1,,vm)dvR1dvI1dvRmdvIm=xf(v)dv

特别地:

∫ − ∞ ∞ f ( x ) d x = 1 \int_{-\infty}^{\infty} f(x)dx = 1 f(x)dx=1

二、随机向量的统计描述

分布函数和概率函数常常不可知, 但是随机向量可以很容易在一阶和二阶统计量上使用.

1. 均值向量

随机向量的最重要统计运算为数学期望, 考察 m × 1 m \times 1 m×1 随机向量 x ( ξ ) = [ x 1 ( ξ ) , x 2 ( ξ ) , … , x m ( ξ ) ] T x(\xi) = [x_1(\xi),x_2(\xi),\dots,x_m(\xi)]^{\mathrm{T}} x(ξ)=[x1(ξ),x2(ξ),,xm(ξ)]T. 令随机变量 x i ( ξ ) x_i(\xi) xi(ξ) 的均值 E { x i ( ξ ) } = μ i E \left \{ x_i(\xi)\right \} = \mu_i E{ xi(ξ)}=μi, 则随机向量的数学期望称为均值向量, 记作 μ x \mu_x μx 定义为

μ x = E { x ( ξ ) } = [ E { x 1 ( ξ ) } E { x 2 ( ξ ) } ⋮ E { x m ( ξ ) } ] = [ μ 1 μ 2 ⋮ μ m ] \mu_x = E \left \{ x(\xi)\right \} = \begin{bmatrix} E \left \{ x_1(\xi)\right \} \\ E \left \{ x_2(\xi)\right \} \\ \vdots \\ E \left \{ x_m(\xi)\right \} \end{bmatrix} = \begin{bmatrix} \mu_1 \\ \mu_2 \\ \vdots \\ \mu_m \end{bmatrix} μx=E{ x(ξ)}=E{ x1(ξ)}E{ x2(ξ)}E{ xm(ξ)}=μ1μ2μm

式子中的数学期望为

E { x ( ξ ) } = d e f ∫ − ∞ ∞ x f ( x ) d x E \left \{ x(\xi)\right \} \overset{def}{=} \int_{-\infty}^{\infty}xf(x)dx E{ x(ξ)}=defxf(x)dx

可以看出均值向量的元素是随机向量各个元素的均值.

2. 相关矩阵与协方差矩阵

知乎上面有篇文章对这部分有解释, 链接:https://zhuanlan.zhihu.com/p/447221519.

均值向量是随机向量的一阶矩, 描述随机向量的元素围绕其均值的散布情况. 但是随机向量二阶矩为矩阵, 描述随机向量分布的散布情况.

自相关矩阵定义为样本向量与自身的外积的数学期望, 其实就是自协方差矩阵不减去均值向量. 随机向量的自相关矩阵定义为

R x = d e f E { x ( ξ ) x H ( ξ ) } [ r 11 r 12 ⋯ r 1 m r 21 r 22 ⋯ r 2 m ⋮ ⋮ ⋮ r m 1 r m 2 ⋯ r m m ] R_x \overset{def}{=} E \left \{ x(\xi) x^{\mathrm{H}}(\xi)\right \} \begin{bmatrix} r_{11}& r_{12}& \cdots& r_{1m}\\ r_{21}& r_{22}& \cdots& r_{2m}\\ \vdots& \vdots& & \vdots\\ r_{m1}& r_{m2}& \cdots& r_{mm} \end{bmatrix} Rx=defE{ x(ξ)xH(ξ)}r11r21rm1r12r22rm2r1mr2mrmm

式中, r i i , i = 1 , 2 , … , m r_{ii}, i = 1,2,\dots,m rii,i=1,2,,m 表示随机变量 x i ( ξ ) x_i(\xi) xi(ξ) 的自相关函数, 定义为

r i i = d e f E { ∣ x i ( ξ ) ∣ 2 } , i = 1 , 2 , … , m r_{ii} \overset{def}{=} E \left \{ |x_i(\xi)|^2 \right \}, \quad i = 1,2,\dots,m rii=defE{ xi(ξ)2},i=1,2,,m

r i j r_{ij} rij 表示随机变量 x i ( ξ ) x_i(\xi) xi(ξ) x j ( ξ ) x_j(\xi) xj(ξ) 之间的互相关函数, 定义为

r i j = d e f E { x i ( ξ ) x j ∗ ( ξ ) } , i , j = 1 , 2 , … , m , i ≠ j r_{ij} \overset{def}{=} E \left \{ x_i(\xi) x_j^*(\xi) \right \}, \quad i,j = 1,2,\dots,m, i \neq j rij=defE{ xi(ξ)xj(ξ)},i,j=1,2,,m,i=j

可以得出自相关矩阵是共轭对称的, 即为 H e r m i t i a n Hermitian Hermitian 矩阵.

随机变量 x ( ξ ) x(\xi) x(ξ) 的自协方差矩阵定义为

C x = d e f E { [ x ( ξ ) − μ x ] [ x ( ξ ) − μ x ] H } = [ c 11 c 12 ⋯ c 1 m c 21 c 22 ⋯ c 2 m ⋮ ⋮ ⋮ c m 1 c m 2 ⋯ c m m ] C_x \overset{def}{=} E \left \{ [x(\xi) - \mu_x][x(\xi) - \mu_x]^{\mathrm{H}} \right \} = \begin{bmatrix} c_{11}& c_{12}& \cdots& c_{1m}\\ c_{21}& c_{22}& \cdots& c_{2m}\\ \vdots& \vdots& & \vdots\\ c_{m1}& c_{m2}& \cdots& c_{mm} \end{bmatrix} Cx=defE{ [x(ξ)μx][x(ξ)μx]H}=c11c21cm1c12c22cm2c1mc2mcmm

主对角线上的元素

c i i = d e f E { ∣ x ( ξ ) − μ x ∣ 2 } , i = 1 , 2 , … , m c_{ii} \overset{def}{=} E \left \{ |x(\xi) - \mu_x|^2\right \}, \quad i = 1,2,\dots,m cii=defE{ x(ξ)μx2},i=1,2,,m

表示随机变量 x i ( ξ ) x_i(\xi) xi(ξ) 的方差 σ i 2 \sigma_i^2 σi2, 其他非对角线元素

c i j = d e f E { [ x i ( ξ ) − μ i ] [ x j ( ξ ) − μ j ] ∗ } = E { x i ( ξ ) x j ∗ ( ξ ) − u i u j ∗ = c j i ∗ } c_ij \overset{def}{=} E \left \{ [x_i(\xi) - \mu_i][x_j(\xi) - \mu_j]^* \right \} = E \left \{ x_i(\xi)x_j^*(\xi) - u_iu_j^* = c_{ji}^* \right \} cij=defE{ [xi(ξ)μi][xj(ξ)μj]}=E{ xi(ξ)xj(ξ)uiuj=cji}

表示随机变量 x i ( ξ ) x_i(\xi) xi(ξ) x j ( ξ ) x_j(\xi) xj(ξ) 之间的协方差. 自协方差矩阵也是 H e r m i t i a n Hermitian Hermitian 矩阵.

自相关矩阵和自协方差矩阵之间存在下列关系

C x = R x = μ x μ x H C_x = R_x = \mu_x\mu_x^{\mathrm{H}} Cx=Rx=μxμxH

推广自相关矩阵和自协方差矩阵, 则有随机向量 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 的互相关矩阵

R x y = d e f E { x ( ξ ) y H ( ξ ) } = [ r x 1 , y 1 r x 1 , y 2 ⋯ r x 1 , y m r x 2 , y 1 r x 2 , y 2 ⋯ r x 2 , y m ⋮ ⋮ ⋮ ⋮ r x m , y 1 r x m , y 2 ⋯ r x m , y m ] R_{xy} \overset{def}{=} E \left \{ x(\xi)y^{\mathrm{H}}(\xi)\right \} = \begin{bmatrix} r_{x_1,y_1}& r_{x_1,y_2}& \cdots& r_{x_1,y_m}\\ r_{x_2,y_1}& r_{x_2,y_2}& \cdots& r_{x_2,y_m}\\ \vdots& \vdots& \vdots& \vdots\\ r_{x_m,y_1}& r_{x_m,y_2}& \cdots& r_{x_m,y_m} \end{bmatrix} Rxy=defE{ x(ξ)yH(ξ)}=rx1,y1rx2,y1rxm,y1rx1,y2rx2,y2rxm,y2rx1,ymrx2,ymrxm,ym

和互协方差矩阵

C x y = d e f E { [ x ( ξ ) − μ x ] [ y ( ξ ) − μ y ] H } = R x y μ x μ y H = [ c x 1 , y 1 c x 1 , y 2 ⋯ c x 1 , y m c x 2 , y 1 c x 2 , y 2 ⋯ c x 2 , y m ⋮ ⋮ ⋮ ⋮ c x m , y 1 c x m , y 2 ⋯ c x m , y m ] \begin{aligned} C_{xy} &\overset{def}{=} E \left \{[x(\xi)-\mu_x][y(\xi)-\mu_y]^{\mathrm{H}}\right \} \\ &= R_{xy} \quad \mu_x \mu_y^{\mathrm{H}} \\ &= \begin{bmatrix} c_{x_1,y_1}& c_{x_1,y_2}& \cdots& c_{x_1,y_m}\\ c_{x_2,y_1}& c_{x_2,y_2}& \cdots& c_{x_2,y_m}\\ \vdots& \vdots& \vdots& \vdots\\ c_{x_m,y_1}& c_{x_m,y_2}& \cdots& c_{x_m,y_m} \end{bmatrix} \end{aligned} Cxy=defE{ [x(ξ)μx][y(ξ)μy]H}=RxyμxμyH=cx1,y1cx2,y1cxm,y1cx1,y2cx2,y2cxm,y2cx1,ymcx2,ymcxm,ym

3. 两个随机向量统计不相关与正交

一句话, 当采样点 ξ \xi ξ 取一系列值会产生多个随机信号. 随机信号减去均值得到随机变化部分. 这一部分共性相乘会增强, 非共性相乘会在期望平均运算后抵消. 而互协方差函数就能完成这一步, 所以互协方差函数越大, 产生的两个随机信号的相关程度越强; 反之, 相关程度越弱.

两个随机变量 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 之间的相关系数定义为

ρ x y = d e f c x y E { ∣ x ( ξ ) ∣ 2 } E { ∣ y ( ξ ) ∣ 2 } = c x y σ x σ y \rho_{xy} \overset{def}{=} \frac{c_{xy}}{\sqrt{E\left \{ |x(\xi)|^2\right\} E\left \{ |y(\xi)|^2\right\}}} = \frac{c_{xy}}{\sigma_x \sigma_y} ρxy=defE{ x(ξ)2}E{ y(ξ)2} cxy=σxσycxy

c x y c_{xy} cxy 是随机变量 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 之间的互协方差, 而 σ x 2 \sigma_x^2 σx2 σ y 2 \sigma_y^2 σy2 分布是 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 的方差. 由相对系数的定义公式使用 C a u c h y − S c h w a r t z Cauchy-Schwartz CauchySchwartz 不等式可得

0 ≤ ∣ ρ x y ∣ ≤ 1 0 \le |\rho_{xy}| \le 1 0ρxy1

相关系数 ρ x y \rho_{xy} ρxy 给出两个随机变量 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 之间的相似程度. ρ x y \rho_{xy} ρxy 越靠近 1 则相似度越大, 越靠近 0 则相似度越小.

ρ x y \rho_{xy} ρxy 等于 0 时说明两个随机变量 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 统计不相关.

得出定义:

若两个随机变量 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ)的互协方差矩阵等于零矩阵, 即 C x y = O C_{xy} = O Cxy=O. 则称两个随机变量 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 统计不相关.

若它们的互相关等于零, 即

r x y = E { x ( ξ ) y ∗ ( ξ ) } = 0 r_{xy} = E \left \{ x(\xi)y^*(\xi) \right \} = 0 rxy=E{ x(ξ)y(ξ)}=0

则将这两个随机变量 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 称为正交.

若两个随机向量 x ( ξ ) \mathbf{x}(\xi) x(ξ) y ( ξ ) \mathbf{y}(\xi) y(ξ) 的互相关矩阵等于零矩阵, 即 R x y = O R_{xy} = O Rxy=O, 则称这两个随机向量正交.

4. 随机向量的线性变换

A A A 为一复常数矩阵, 则
y ( ξ ) = A x ( ξ ) y(\xi) = Ax(\xi) y(ξ)=Ax(ξ)

是复正态随机向量 x ( ξ ) ∼ C N ( μ x , Γ x ) x(\xi) \sim CN(\mu_x, \Gamma_x) x(ξ)CN(μx,Γx) 的线性变换. 线性变换 y ( ξ ) = A x ( ξ ) y(\xi) = Ax(\xi) y(ξ)=Ax(ξ) 仍然为正态随机向量, 记作 y ( x ) ∼ C N ( μ y , Γ y ) y(x) \sim CN(\mu_y, \Gamma_y) y(x)CN(μy,Γy)

其均值向量为
μ y = E { y ( ξ ) } = E { A x ( ξ ) } = A E { A x ( ξ ) } = A μ x \mu_y = E \left\{ y(\xi) \right\} = E \left\{ Ax(\xi) \right\} = AE \left\{ Ax(\xi) \right\} = A\mu_x μy=E{ y(ξ)}=E{ Ax(ξ)}=AE{ Ax(ξ)}=Aμx

自相关矩阵为
R y = E { y ( ξ ) y H ( ξ ) } = E { A x ( ξ ) x H ( ξ ) A H } = A E { x ( ξ ) x H ( ξ ) } A H = A R x A H R_y = E\left\{ y(\xi)y^{\mathrm{H}}(\xi) \right\} = E \left\{ Ax(\xi)x^{\mathrm{H}}(\xi)A^{\mathrm{H}} \right\} = AE\left\{ x(\xi)x^{\mathrm{H}}(\xi) \right\}A^{\mathrm{H}} = AR_xA^{\mathrm{H}} Ry=E{ y(ξ)yH(ξ)}=E{ Ax(ξ)xH(ξ)AH}=AE{ x(ξ)xH(ξ)}AH=ARxAH

自协方差矩阵为
C y = A C x A H C_y = AC_xA^{\mathrm{H}} Cy=ACxAH

随机向量 x ( ξ ) x(\xi) x(ξ) 与线性变换 y ( ξ ) = A x ( ξ ) y(\xi) = Ax(\xi) y(ξ)=Ax(ξ) 的互相关矩阵为
R x y = E { x ( ξ ) y H ( ξ ) } = E { x ( ξ ) x H ( ξ ) A H } = E { x ( ξ ) x H ( ξ ) } A H = R x A H \begin{aligned} R_{xy} &= E\left\{ x(\xi)y^{\mathrm{H}}(\xi) \right\} = E\left\{ x(\xi)x^{\mathrm{H}}(\xi)A^{\mathrm{H}} \right\} \\ &= E\left\{ x(\xi)x^{\mathrm{H}}(\xi) \right\}A^{\mathrm{H}} = R_xA^{\mathrm{H}} \end{aligned} Rxy=E{ x(ξ)yH(ξ)}=E{ x(ξ)xH(ξ)AH}=E{ x(ξ)xH(ξ)}AH=RxAH

于是
R y x = R x y H = ( R x A H ) H = A R x R_{yx} = R_{xy}^{\mathrm{H}} = (R_xA^{\mathrm{H}})^{\mathrm{H}} = AR_x Ryx=RxyH=(RxAH)H=ARx

同理可得随机向量 x ( ξ ) x(\xi) x(ξ) 与其线性变换 y ( ξ ) = A x ( ξ ) y(\xi) = Ax(\xi) y(ξ)=Ax(ξ) 之间的互协方差矩阵
C x y = C x A H , C y x = A C x C_{xy} = C_xA^{\mathrm{H}}, \quad C_{yx} = AC_x Cxy=CxAH,Cyx=ACx

三、正态随机向量

若随机向量 x ( ξ ) = [ x 1 ( ξ ) , x 2 ( ξ ) , … , x m ( ξ ) ] T x(\xi) = [x_1(\xi),x_2(\xi),\dots,x_m(\xi)]^{\mathrm{T}} x(ξ)=[x1(ξ),x2(ξ),,xm(ξ)]T 中各个分量为联合正态分布的随机变量则称 x ( ξ ) x(\xi) x(ξ) 为正态随机向量.

一个均值向量为 μ x \mu_x μx 和协方差矩阵为 Γ x \Gamma_x Γx 的实正态随机向量记作 x ∼ N ( μ x , Γ x ) x \sim N(\mu_x,\Gamma_x) xN(μx,Γx), 其概率密度为

f ( x ) = 1 ( 2 π ) m / 2 ∣ Γ x ∣ 1 / 2 e x p [ − 1 2 ( x − μ x ) T Γ x − 1 ( x − μ x ) ] f(x) = \frac{1}{(2\pi)^{m/2}|\Gamma_x|^{1/2}}exp [-\frac{1}{2}(x-\mu_x)^{\mathrm{T}}\Gamma_x^{-1}(x-\mu_x) ] f(x)=(2π)m/2Γx1/21exp[21(xμx)TΓx1(xμx)]

其中 ∣ Γ x ∣ |\Gamma_x| Γx 表示矩阵 Γ x \Gamma_x Γx 的行列式, 指数项 ( x − μ x ) T Γ x − 1 ( x − μ x ) (x - \mu_x)^{\mathrm{T}}\Gamma_x^{-1}(x-\mu_x) (xμx)TΓx1(xμx) x i x_i xi 的正定二次型函数, 也可以写作

( x − μ x ) T Γ x − 1 ( x − μ x ) = ∑ i = 1 m ∑ j = 1 m Γ x − 1 ( i , j ) ( x i − μ i ) ( x j − μ j ) (x - \mu_x)^{\mathrm{T}}\Gamma_x^{-1}(x-\mu_x) = \sum_{i=1}^{m}\sum_{j=1}^{m}\Gamma_x^{-1}(i,j)(x_i - \mu_i)(x_j - \mu_j) (xμx)TΓx1(xμx)=i=1mj=1mΓx1(i,j)(xiμi)(xjμj)

其中 Γ x − 1 ( i , j ) \Gamma_x^{-1}(i,j) Γx1(i,j) 表示逆矩阵 Γ x − 1 \Gamma_x^{-1} Γx1 ( i , j ) (i,j) (i,j) 元素, μ i = E { x i } \mu_i = E \left \{ x_i\right \} μi=E{ xi} 是随机变量 x i x_i xi 的均值.

实正态随机向量的特征函数为

Φ x ( ω ) = e x p ( j ω T μ x = 1 2 ω T Γ x ω ) \Phi_x(\omega) = exp(j\omega^{\mathrm{T}}\mu_x = \frac{1}{2}\omega^{\mathrm{T}}\Gamma_x\omega) Φx(ω)=exp(jωTμx=21ωTΓxω)

式中, ω = [ ω 1 , … , ω m ] T \omega = [\omega_1,\dots,\omega_m]^{\mathrm{T}} ω=[ω1,,ωm]T

对复正态随机向量, 令 x = [ x 1 , … , x m ] T x = [x_1,\dots,x_m]^{\mathrm{T}} x=[x1,,xm]T, 其每个元素服从复正态分布, 即 x i ∼ C N ( μ i . σ i 2 ) x_i \sim CN(\mu_i.\sigma_i^2) xiCN(μi.σi2), 则 x x x 称为复正态随机向量, 记作 x ∼ C N ( μ x , Γ x ) x \sim CN(\mu_x,\Gamma_x) xCN(μx,Γx), 其中, μ x = [ μ 1 , … , μ m ] T \mu_x = [\mu_1,\dots,\mu_m]^{\mathrm{T}} μx=[μ1,,μm]T. 若 x i = μ i + j v i x_i = \mu_i + jv_i xi=μi+jvi, 并且实随机向量 [ μ 1 , v 1 ] T , … , [ μ m , v m ] T [\mu_1,v_1]^{\mathrm{T}},\dots,[\mu_m,v_m]^{\mathrm{T}} [μ1,v1]T,,[μm,vm]T 统计独立, 则复随机正态向量 x x x 的概率密度函数为

f ( x ) = ∏ i = 1 m f ( x i ) = ( π m ∏ i = 1 m σ i 2 ) − 1 e x p ( − ∑ i = 1 m 1 σ i 2 ∣ x i − μ i 2 ∣ ) = 1 π m ∣ Γ x ∣ e x p [ − ( x − μ x ) H Γ x − 1 ( x − μ x ) ] \begin{aligned} f(x) &= \prod_{i=1}^{m}f(x_i) = (\pi^m\prod_{i=1}^{m}\sigma_i^2)^{-1}exp(-\sum_{i=1}^{m}\frac{1}{\sigma_i^2}|x_i-\mu_i^2|) \\ &= \frac{1}{\pi^m|\Gamma_x|}exp[-(x-\mu_x)^{\mathrm{H}}\Gamma_x^{-1}(x-\mu_x)] \end{aligned} f(x)=i=1mf(xi)=(πmi=1mσi2)1exp(i=1mσi21xiμi2)=πmΓx1exp[(xμx)HΓx1(xμx)]

式子中, Γ x = d i a g ( σ 1 2 , … , σ m 2 ) \Gamma_x = diag(\sigma_1^2,\dots,\sigma_m^2) Γx=diag(σ12,,σm2), 复正态随机变量的特征函数由下式给出

Φ x ( ω ) = e x p [ j R e ( ω H μ x ) − 1 4 ω H Γ x ω ] \Phi_x(\omega) = exp[j\mathrm{Re}(\omega^{\mathrm{H}}\mu_x) - \frac{1}{4}\omega^{\mathrm{H}}\Gamma_x\omega] Φx(ω)=exp[jRe(ωHμx)41ωHΓxω]

正态随机向量具有非常重要的几个性质

  • 概率密度函数由均值向量和协方差矩阵完全描述.

  • 若正态随机向量的各个分量相互统计不相关, 则它们也是统计独立的.

  • 均值向量 μ x \mu_x μx 和协方差矩阵 Γ x \Gamma_x Γx 的正态随机向量 x x x 的线性变换 y ( ξ ) = A x ( ξ ) y(\xi) = Ax(\xi) y(ξ)=Ax(ξ) 仍然是正态随机向量, 其概率密度函数为

实正态随机向量概率密度函数
f ( y ) = 1 ( 2 π ) m / 2 ∣ Γ y ∣ 1 / 2 e x p [ − 1 2 ( y − μ y ) T Γ y − 1 ( y − μ y ) ] f(y) = \frac{1}{(2\pi)^{m/2}|\Gamma_y|^{1/2}}exp [-\frac{1}{2}(y-\mu_y)^{\mathrm{T}}\Gamma_y^{-1}(y-\mu_y) ] f(y)=(2π)m/2Γy1/21exp[21(yμy)TΓy1(yμy)]

复正态随机向量概率密度函数
f ( y ) = 1 π m ∣ Γ y ∣ e x p [ − ( y − μ y ) H Γ y − 1 ( y − μ y ) ] f(y) = \frac{1}{\pi^m|\Gamma_y|}exp[-(y-\mu_y)^{\mathrm{H}}\Gamma_y^{-1}(y-\mu_y)] f(y)=πmΓy1exp[(yμy)HΓy1(yμy)]

猜你喜欢

转载自blog.csdn.net/qq_44309220/article/details/124870660