一、多维随机变量的协方差矩阵
对多维随机变量列向量,我们往往需要计算各维度之间的协方差,这样协方差就组成了一个n×nn×n的矩阵,称为协方差矩阵。协方差矩阵是一个对角矩阵,对角线上的元素是各维度上随机变量的方差。 我们定义协方差为, 矩阵内的元素为
协方差矩阵为
二、样本的协方差矩阵
与上面的协方差矩阵相同,只是矩阵内各元素以样本的协方差替换。假设数据集表示m个样本, 每个样本表示为。所有样本可以组成一个的矩阵。
每一行代表一个对象,每一列代表一个维度,协方差矩阵,是求维度之间的相关性,而不是对象之间的,所以协方差矩阵的大小与维度相关。表示第i维的随机变量。
假设,则有
这里分母为m−1是因为随机变量的数学期望未知,以样本均值代替,自由度减一。