机器学习之数理统计与参数估计

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_16633405/article/details/82085784

目录:

1、知道期望/方差/偏度/峰度,独立和不相关等概念是什么。

期望(均值):离散型和连续型。(求面积)
这里写图片描述
方差:表示数据的离散程度。对应的表达式:E(x2)-E2(x)
这里写图片描述

偏度的数学含义:衡量随机变量概率分布的不对称性。
这里写图片描述
峰度的数学含义:是概率密度在均值处峰值高低的特征。
这里写图片描述

了解如何判断两个事件独立,由于A与B相互独立所以P(A|B)=P(A)。
独立与不相关的关系(独立是不相关的充分不必要条件)

2、契比雪夫不等式

知道切比雪夫不等式数学含义:随机变量X服从正态分布,则X的取值基本上集中在期望μ附近。
这里写图片描述

3、大数定理/中心极限定理

知道大数定律的意义:当数据足够多,数据的平均值也就趋近于期望μ。
这里写图片描述
这里写图片描述
中心极限定理:随机变量Xi互相独立,服从同一分布且具有相同的期望μ和方差σ2则随机变量收敛到正态分布。
中心极限定理的意义:现实生活中的很多随机现象可以看做是许多因素独立影响的综合反映,往往近似服从正态分布。

4、伯努利定理

伯努利定理:是大数定理的初级版本,有特殊的意义即用频率来估计概率提供了一个理论依据。

5、矩估计

矩估计:矩估计可以求得期望和方差的值:相当于管中窥豹,以部分数据推导出对应的均值和方差。
矩:描述变量的分布形状。
一阶原点矩指的是随机变量的平均值,即期望值。
二阶中心矩指的是随机变量的方差。
三阶矩指的是随机变量的偏度。
四阶矩指的是随机变量的峰度。
这里写图片描述

6、最大似然估计

似然概率:即独立事件X1、X2…同时发生的概率;
θ代表的是参数,X代表的是样本。
最大似然估计:即确定什么样的参数θ能够使得似然概率取得最大。
这里写图片描述
这里写图片描述
这里写图片描述
过拟合:说的是样本全是性别为男或者女的情况,即样本不具有代表性。

7、协方差和相关系数

标准差:方差开平方
协方差:表示两个变量的离散程度。是方差的一般形式。协方差是两个随机变量是否具有相同方向变化趋势的度量。
这里写图片描述
这里写图片描述
相关系数
这里写图片描述

猜你喜欢

转载自blog.csdn.net/qq_16633405/article/details/82085784
今日推荐