共分散行列と相関係数行列

序文

  このブログでは、主に分散、共分散、相関係数に関する関連知識を紹介し、その後、共分散行列と相関係数行列を紹介し、関連する例とともに説明します。

1. 分散、共分散、相関係数

  「確率論と数学的統計」では、単一の確率変数XXを測定するために分散が使用されます。Xの分散度。 DX DXとして表されます。DX計算式は次のとおりです。
DX = E ( X − EX ) 2 = EX 2 − E 2 X \begin{aligned} DX &= E(X-EX)^2 \\[3pt] &= EX ^2 - E^2X \end{整列}DX _=E ( X2=エクス_2E2X _  数式は次のとおりです。σ 2 ( x ) = 1 n − 1 ∑ i = 1 N ( xi − x ˉ ) 2 \sigma ^2(x) = \frac {1} {n-1}\sum _{i =1} ^N (x_i - \bar x)^2p2 (×)=n11i = 1N( ×私はバツˉ )2

  たった今方差 = 平方的期望 - 期望的平方

  共分散は 2 つの確率変数XXを測定するために使用されます。XYYY間の類似度。 C ov ( X , Y ) Cov(X,Y)として表されます。C o v ( X ,Y )、次のように定義します:
C ov ( X , Y ) = E [ ( X − EX ) ⋅ ( Y − EY ) ] = E ( XY ) − EX ⋅ EY \begin{aligned} Cov(X,Y) & = E[(X - EX) \cdot(Y - EY)] \\[3pt] &= E(XY) - EX \cdot EY \end{aligned}C o v ( X ,=そして[( X( YE Y )]=( XY ) _ええ_  数学的表現: σ ( x , y ) = 1 n − 1 ∑ i = 1 N ( xi − x ˉ ) ( yi − y ˉ ) \sigma (x , y ) = \frac {1} {n-1 }\ sum _{i=1} ^N (x_i - \bar x) (y_i - \bar y)σ ( x ,y )=n11i = 1N( ×私はバツˉ )(そして私はyˉ

  数式の観点から見ると、共分散は 2 つの変数とその変数自身の期待値の差であり、それらを乗算して、積の期待値を計算します。つまり、一方の変数の値がそれ自身の期待値よりも大きく、もう一方の変数の値も自身の期待値よりも大きい場合、つまり 2 つの変数の変化傾向が同じである場合、このとき、2 つの変数間の共分散は正の値になります。逆に、変数の 1 つがそれ自身の期待値よりも大きく、もう 1 つの変数がそれ自身の期待値よりも小さい場合、これら 2 つの変数間の共分散は負の値になります。

  ピアソン相関係数とも呼ばれる相関係数は、2 つの確率変数XX(Pearson)を測定するために使用されます。XYYY間の相関度。ρ XY \rho_{XY}として記録されます。rXY _、計算式は次のとおりです:
ρ XY = C ov ( X , Y ) DXDY \rho_{XY} = \frac {Cov(X,Y)} {\sqrt {DX} \sqrt {DY}}rXY _=DX _ DY_ C o v ( X ,XY > 0 \rho_{XY} >  の場合rXY _>0、確率変数XXXYYYは正の相関関係にあります。ρXY < 0 \rho_{XY} < 0
  の場合rXY _<0、確率変数XXXYYYは負の相関関係にあります。ρXY = 0 \rho_{XY} = 0
  の場合rXY _=0、確率変数XXXYYYは無相関、つまり互いに独立しています。ρXY = ± 1 \rho_{XY} = \pm1
  の場合rXY _=± 1、確率変数XXXYYY は線形関係にあります。

  相関係数は共分散とみなすこともできます: 2 つの変数の次元の影響を排除し、標準化された特別な共分散です。2 つの変数の変化範囲の影響を排除しますが、単に 2 つの変数の変化を反映します。単位ごとに 2 つの変数。

2. 共分散行列

  実際のシナリオでは、オブジェクトを 1 次元または 2 次元だけで記述することはなく、たとえば、ニューラル ネットワーク モデルのパフォーマンスを記述する場合、モデルのサイズ、精度、推論時間を考慮する必要があります。 、など測定する寸法。多次元データ分析を実行する場合、異なる次元間の相関度を共(covariance matrix)分散行列で記述する必要があります。次元間の相関度は共分散行列を構成し、共分散行列の主対角要素はデータの分散です。それぞれの次元に沿って。
  共分散行列の式は次のとおりです。∑ = [ σ ( x 1 , x 1 ) … σ ( x 1 , xn ) ⋮ ⋱ ⋮ σ ( xn , x 1 ) … σ ( xn , xn ) ] \sum = \begin {bmatrix} \sigma (x_1, x_1) & \dots & \sigma (x_1, x_n) \\ \vdots & \ddots & \vdots \\ \sigma (x_n, x_1) & \dots & \sigma (x_n, x_n) ) ) \\ \end{bmatrix}= s ( x1バツ1s ( xバツ1)s ( x1バツs ( xバツ)

3. 相関係数行列

  名前のとおり、相関係数で構成される行列であり(correlation matrix)、係数行列とも呼ばれ、行列内の各要素の値の範囲は です[-1, 1]
  相関係数行列の式は次のとおりです。C = [ ρ ( x 1 , x 1 ) … ρ ( x 1 , xn ) ⋮ ⋱ ⋮ ρ ( xn , x 1 ) … ρ ( xn , xn ) ] = [ 1 … ρ ( x 1 , xn ) ⋮ ⋱ ⋮ ρ ( xn , x 1 ) … 1 ] \begin{aligned} C &= \begin{bmatrix} \rho(x_1, x_1) & \dots & \rho(x_1, x_n ) \\ \vdots & \ddots & \vdots \\ \rho(x_n, x_1) & \dots & \rho(x_n, x_n) \\ \end{bmatrix}\\[5pt] &= \begin{bmatrix} 1 & \dots & \rho(x_1, x_n) \\ \vdots & \ddots & \vdots \\ \rho(x_n, x_1) & \dots & 1 \\ \end{bmatrix} \end{aligned}C= p ( x1バツ1p ( xバツ1)p ( x1バツp ( xバツ) = 1p ( xバツ1)p ( x1バツ1

おすすめ

転載: blog.csdn.net/qq_42730750/article/details/122600973