np.random.multivariate_normal()

np.random.multivariate_normal方法用于根据实际情况生成一个多元正态分布矩阵(正态分布基本概念),其在Python3中的定义如下:


---------------------------正态分布基本概念-------------------------------
正态分布,又称高斯分布。其特征为中间高两边低左右对称。它有以下几个性质:

  • 集中性:曲线的最高峰位于正中央,且位置为均数所在的位置。
  • 对称性:正态分布曲线以均数所在的位置为中心左右对称且曲线两段无线趋近于横轴。
  • 均匀变动性:正态分布曲线以均数所在的位置为中心均匀向左右两侧下降。
  • 面积恒等:曲线与横轴间的面积总等于1。

正态分布函数公式如下:
image.png

其中μ为均数,σ为标准差。μ决定了正态分布的位置,与μ越近,被取到的概率就越大,反之越小。σ描述的是正态分布的离散程度。σ越大,数据分布越分散曲线越扁平;σ越小,数据分布越集中曲线越陡峭。


def multivariate_normal(mean, cov, size=None, check_valid=None, tol=None)

其中mean和cov为必要的传参而size,check_valid以及tol为可选参数。

  • mean:mean是多维分布的均值维度为1;
  • cov:协方差矩阵(协方差基本概念),注意:协方差矩阵必须是对称的且需为半正定矩阵;

------------------------协方差基本概念-----------------------------------
协方差用于表示变量间的相互关系,变量间的相互关系一般有三种:正相关,负相关和不相关。

  • 正相关:假设有两个变量x和y,若x越大y越大;x越小y越小则x和y为正相关。
  • 负相关:假设有两个变量x和y,若x越大y越小;x越小y越大则x和y为负相关。
  • 不相关:假设有两个变量x和y,若x和y变化无关联则x和y为负相关。

协方差的公式如下(2个变量的情况下):
image.png
当维度多的时候可以用协方差矩阵来表示,公式如下:
image.png

注意:协方差矩阵为对称矩阵并且对角线上的元素为各维度的方差。

-------------------------------end--------------------------------

  • size:指定生成的正态分布矩阵的维度(例:若size=(1, 1, 2),则输出的矩阵的shape即形状为 1X1X2XN(N为mean的长度))。
  • check_valid:这个参数用于决定当cov即协方差矩阵不是半正定矩阵时程序的处理方式,它一共有三个值:warn,raise以及ignore。当使用warn作为传入的参数时,如果cov不是半正定的程序会输出警告但仍旧会得到结果;当使用raise作为传入的参数时,如果cov不是半正定的程序会报错且不会计算出结果;当使用ignore时忽略这个问题即无论cov是否为半正定的都会计算出结果。

3种情况的console打印结果如下:

=使用warn时=====
image.png
=使用raise时=====
image.png
=使用ignore时=====
image.png

  • tol:检查协方差矩阵奇异值时的公差,float类型。

最后放一个示例这里生成一个形状为2X2X2的正态分布矩阵,代码及结果如下:

import numpy as np;
mean = (1, 2)
cov = [[1, 0], [0, 1]]
x = np.random.multivariate_normal(mean, cov, (2, 2), 'raise')
print(x)

结果如下:
image.png

来源:https://blog.csdn.net/zch1990s/article/details/80005940

猜你喜欢

转载自blog.csdn.net/xc_zhou/article/details/86701549