一文看懂协方差

千尺之台,起于垒土。——老子。

前言

先给出statistics中的垒土(直观理解 )。

均值mean

E(X)=\bar{X}= \frac{\sum_{i=1}^{n} {X_i}}{n}

标准差 standard deviation

\sqrt{D(x)}=\sqrt{ \frac{\sum_{i=1}^{n} \left({X_i-\bar X} \right ) ^2}{n}}

(平)方差  variance

var(X)=D(X)=\frac{\sum_{i=1}^{n} \left({X_i-\bar X} \right ) ^2}{n}

协方差表示

标准差和variance 描述一维随机变量的散布度,仿照variance的定义,得到

协方差 covariance

cov(X,Y)=\frac{\sum_{i=1}^{n} \left({X_i-\bar X} \right ) \left({Y_i-\bar Y} \right ) }{n}

covariance 表示两个随机变量的关系。 (使用英文直接表示的重要性。。。)

covariance的值为0证明不相关,为正则正相关,vice versa。

相关系数

XY直接的相关系数表示成\large \rho _{XY}, 取值在-1-1之间,如果不相关则为0,vice versa。

\large \rho _{XY}=\frac{cov(X,Y)}{\sqrt{D(X) }\sqrt{D(Y) }}

covariance 矩阵

n维随机变量的协方差  \large C_{ij}=cov(X_i,Y_j) \qquad (i,j=1,2,\cdots,n )  都存在,则

covariance 矩阵如下:

\large \boldsymbol{C}=\begin{vmatrix} C_{11 }& \cdots &C_{1n } \\ \vdots& & \vdots \\ C_{n1 }& \cdots & C_{nn } \end{vmatrix}

举例说明:

二维随机变量\large (X_1,X_2) \sim N(\mu _1,\mu _2,\delta _1^2,\delta_2^2,\rho ),  其中 \large \rho  是相关系数 。

则covariance matrix如下

 \large \boldsymbol{C}=\begin{pmatrix} C_{11} &C_{12} \\ C_{21} & C_{22} \end{pmatrix} =\begin{pmatrix} D(X_1) &cov(X_1,X_2) \\ cov(X_2,X_1) & D(X_2) \end{pmatrix} = \begin{pmatrix}\delta_1^2 &\rho \delta_1 \delta_2 \\ \rho \delta_1 \delta_2 & \delta_2^2 \end{pmatrix}

发布了128 篇原创文章 · 获赞 21 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/Bluenapa/article/details/102521233