征服统计学02|什么是正态分布?

本文简单介绍正态分布

目录

正态分布简介

正态分布关键参数:均值&&标准差

正态分布曲线如何绘制

正态分布曲线现象解释

Reference


正态分布简介

正态分布(Normal distribution),又名高斯分布(Gaussian distribution),又因其曲线酷似钟形,得名钟形曲线

还是以上篇提到的测量身高为例,上图正态分布曲线X轴表示人群身高,Y轴表示某个身高对应的概率;

上图绿圈部分,极端矮小或者极端高大的身高都是少数,概率相对低,曲线矮

上图蓝圈部分,大部分人身高都处于均值身高附近,概率相对大,曲线高

正态分布关键参数:均值&&标准差

不同正态分布主要区别在曲线的宽度(标准差控制)和曲线中心位置(均值控制);

例,上图为新生儿(左图)和成人(右图)身高的两个正态分布,新生儿身高均值为20英寸,成人身高均值为70英寸。

看图说话:

正态分布总是以均值为中心,从图中大约可见新生儿身高主要分布在19~21英寸,成人身高主要分布在60~80英寸;

新生儿正态分布曲线比成人正态分布曲线高很多,这是因为新生儿身高落在相对高身高的概率比成人更大,粗暴理解为前者只有19~21英寸可选,后者有60~80英寸相对宽的范围可选,可选范围越小,落在某个具体的身高上概率就越高

正态分布曲线宽度标准差(Standard Deviation)决定,越大越宽,左图为0.6,右图为4,效果一目了然;

正态分布曲线绘制时,使得95%的测量值落在均值±标准差的范围内,所有左右图红圈分别为20±2x0.6及70±2x4所得,直接回答了正态分布曲线宽度标准差说了算~~~;

正态分布曲线如何绘制

看图说话:

要绘制一个标准正态分布曲线,第一个关键参数为均值,决定曲线的中心位置

第二个关键参数为标准差,决定曲线宽度,间接决定曲线高度,曲线越宽越矮,越窄越高。

正态分布曲线现象解释

正态分布曲线在自然界中非常常见,如人的身高、体重、上下班时间等等,对数据统计非常有用,那是什么导致了正态分布的现象了,请看下篇中心极限定理(The central limit theorem).

Reference

个人能力有限,欢迎指出不足,也可以去看原版:

https://www.bilibili.com/video/BV1iJ411R7zf?p=3

猜你喜欢

转载自blog.csdn.net/qq_21478261/article/details/111413729