机器学习(二)概率密度分布之参数估计

版权声明: https://blog.csdn.net/qq_26386707/article/details/79341626

机器学习(二)概率密度估计之参数估计

2018/2/19
by ChenjingDing


概率密度估计总体上可分为两种方法,参数估计和非参数估计的方法。

一.参数估计

假设随机变量服从不同的分布,则可以求取该分布概率密度函数的参数。频率学派认为该参数是固定的,因此产生了最大似然估计。而贝叶斯学派认为该参数也是随机变量,产生了贝叶斯学习的方法。

1.1最大似然估计

*1.1.1最大似然估计的基本原理

目标函数
找到参数 θ 使得样本x出现的概率最大。即: θ = a r g m a x θ p ( x | θ )
利用导数求极值

L ( θ ) = p ( x | θ ) = i = 1 n p ( x i | θ ) ( ) E ( θ ) = ln p ( x | θ ) = ln i = 1 n p ( x i | θ ) = i = 1 n ln p ( x i | θ )
m a x L ( θ ) 就相当于 m i n E ( θ ) ,所以目标函数是 θ = a r g m i n θ E ( θ )
E ( θ ) θ = i = 1 n ln p ( x i | θ ) θ = i = 1 n p ( x i | θ ) p ( x i | θ ) θ = 0
根据上式即可求得 θ

1.1.2高斯分布的最大似然估计

假设随机变量X服从一维高斯分布,样本 x = ( x 1 , x 2 . . . x n 1 , x n ) ,则参数 θ = ( μ σ )
先求 μ ^ : E ( θ ) θ = i = 1 n 2 ( x i μ ^ ) 2 σ 2 = 1 σ 2 [ i = 1 n x i n μ ^ ] = 0

μ ^ = 1 n i = 1 n x i
同理:
σ ^ 2 = 1 n i = 1 n ( x i μ ^ ) 2
无偏估计
μ ^ 是无偏估计:
E ( μ ^ ) = E ( 1 n i = 1 n x i ) = 1 n i = 1 n E ( x i ) = μ , E ( x i ) = E ( X ) :
σ ^ 2 是渐进无偏估计:
E ( σ ^ 2 ) = E ( 1 n i = 1 n ( x i μ ^ ) 2 ) = E ( 1 n i = 1 n ( x i 2 2 x i μ ^ + μ ^ 2 ) ) = E ( 1 n i = 1 n ( x i 2 ) 2 μ ^ 2 + μ ^ 2 ) = [ 1 n i = 1 n E ( x i 2 ) ] E ( μ ^ 2 ) = [ 1 n i = 1 n [ D ( x i ) + E ( x i ) 2 ] ] [ D ( μ ^ ) + E ( μ ^ ) 2 ] = 1 n [ n σ 2 + n μ 2 ] [ σ 2 n + μ 2 ] = n 1 n σ 2
上述推导用到以下两个公式:
1. D ( X ) = E ( X 2 ) E ( X ) 2 ;
2. D ( μ ^ ) = D ( 1 n i = 1 n x i ) = 1 n 2 D ( i = 1 n x i ) = 1 n 2 i = 1 n D ( x i ) ( ) = σ n ;

所以,需要修改 σ ^ 2 ,使得

σ ^ c o r r 2 = n n 1 σ ^ 2

1.2贝叶斯学习

1.2.1 贝叶斯学习估计参数

暂时跳过。

*1.2.2 贝叶斯学习预测

x是已知样本。 x ^ 是需要被预测的数据,即另一个未知的样本数据, 样本之间相互独立同分布。

p ( x ^ | x ) = p ( x ^ , θ | x ) d θ = p ( x ^ | x , θ ) p ( θ | x ) d θ = p ( x ^ | θ ) p ( θ | x ) d θ   ( x ^ x θ ) = p ( x ^ | θ ) p ( x | θ ) p ( θ ) p ( x ) d θ = p ( x ^ | θ ) p ( x | θ ) p ( θ ) p ( x | θ ) p ( θ ) d θ d θ ( p ( x ) = p ( x | θ ) p ( θ ) d θ , )

考完试,再来系统更新这部分,了解更多:
https://www.youtube.com/watch?v=Vd_gKry3h4s (贝叶斯学习)
https://www.youtube.com/watch?v=ZL5cv1FiFn4 ( 贝叶斯预测)
https://www.youtube.com/playlist?list=PLFDbGp5YzjqXQ4oE4w9GVWdiokWB9gEpm(系统学习贝叶斯学习)

猜你喜欢

转载自blog.csdn.net/qq_26386707/article/details/79341626