一、题目
a)极大似然估计
X为伯努利分布,并且
Pr(X=1)=1−Pr(X=0)=π,并且在给定
X=j (j=0,1)时,
Y的分布为均值
μj,方差
σ2。
针对一份完整随机样本
(xi,yi),i=1,...,n,计算
(π,μ0,μ1,σ2)的极大似然估计并计算
Y的边际均值与方差。
b)缺失数据的极大似然估计
假设现在
X是完整的观测,但
Y有
n−r个值缺失,请使用第七章的方法,计算
Y的边际均值与方差。
c)从后验分布中生成参数
当先验分布表现为
p(π,μ0,μ1,logσ2)∝π1/2(1−π)1/2的形式,描述如何从参数为
(π,μ0,μ1,σ2)的后验分布中抽出参数。
(注:前面的逗号均使用全角,后面公式中的逗号为半角,中文字中间的逗号为全角。)
二、解答
a)极大似然估计
写出联合密度函数,首先列出一个样本时的密度:
==f(xi,yi∣μ0,μ1,σ2,π)f(xi∣π)⋅f(yi∣xi,μ0,μ1,σ2,π)πxi⋅(1−π)1−xi⋅(2πσ2
1exp{−2σ2(yi−μ1)2})xi⋅(2πσ2
1exp{−2σ2(yi−μ0)2})1−xi
n个样本的联合密度函数:
==f(X,Y∣μ0,μ0,σ2,π)i=1∏nf(xi∣π)⋅f(yi∣xi,μ0,μ1,σ2,π)i=1∏nπxi⋅(1−π)1−xi⋅(2πσ2
1exp{−2σ2(yi−μ1)2})xi⋅(2πσ2
1exp{−2σ2(yi−μ0)2})1−xi
对数似然函数:
====lnf(X,Y∣μ0,μ1,σ2,π)lni=1∏nf(xi∣π)⋅f(yi∣xi,μ0,μ1,σ2,π)lni=1∏nπxi⋅(1−π)1−xi⋅(2πσ2
1exp{−2σ2(yi−μ1)2})xi⋅(2πσ2
1exp{−2σ2(yi−μ0)2})1−xii=1∑n{xilnπ+(1−xi)ln(1−π)−2xiln(2πσ2)−2σ2xi(yi−μ1)2−21−xiln(2πσ2)−2σ2(1−xi)(yi−μ0)2}i=1∑nxilnπ+(n−i=1∑nxi)ln(1−π)−2nln(2πσ2)−i=1∑n2σ2xi(yi−μ1)2−i=1∑n2σ2(1−xi)(yi−μ0)2}
对上式求偏导,使其等于
0即可得极大似然估计
∂μ1∂lnf(X,Y∣μ0,μ1,σ2,π)====∂μ0∂lnf(X,Y∣μ0,μ1,σ2,π)∂σ2∂lnf(X,Y∣μ0,μ1,σ2,π)∂π∂lnf(X,Y∣μ0,μ1,σ2,π)0
可解得:
π^=μ0^=μ1^=σ2^=n∑i=1nxi∑i=1n(1−xi)∑i=1n(1−xi)yi∑i=1nxi∑i=1nxiyin∑i=1nyi2−n∑i=1n(1−xi)[∑i=1n(1−xi)yi]2−n∑i=1nxi(∑i=1nxiyi)2
由于
σ2^的计算相对麻烦,这里将其详细的计算过程写出:
∂σ2∂lnf(X,Y∣μ0,μ1,σ2,π)=−2n⋅−2πσ2^1⋅2π+2(σ2^)2∑i=1nxi(yi−μ1^)2+2(σ2^)2∑i=1n(1−xi)(yi−μ0^)2}=i=1∑nxi(yi−∑i=1nxi∑i=1nxiyi)2+i=1∑n(1−xi)(yi−∑i=1n(1−xi)∑i=1n(1−xi)yi)2=n∑i=1nyi2−n∑i=1n(1−xi)[∑i=1n(1−xi)yi]2−n∑i=1nxi(∑i=1nxiyi)2=00nσ2^σ2^
均值与方差为:
将随机变量
X求和掉,可求得
Y的边际分布:
Y=(1−π)Y0+πY1
其中:
Y0∼Y1∼N(μ0,σ2)N(μ1,σ2)
对其求期望与方差:
EY=(1−π)μ0+πμ1
Var(Y)=(1−π)2σ2+π2σ2
则
Y边际均值的估计为:
(1−π^)μ0^+π^μ1^
边际方差的估计为:
(1−π^)2σ2^+π^2σ2^
将前面的估计得到的参数带入即可。
b)带缺失数据的极大似然估计
联合密度函数:
====f(X,Yobs∣μ0,μ1,σ2,π)i=1∏rf(xi,yi∣μ0,μ1,σ2,π)⋅i=r+1∏nf(xi∣π)i=1∏rf(xi∣π)f(yi∣xi,μ0,μ1,σ2,π)⋅i=r+1∏nf(xi∣π)i=1∏nf(xi∣π)⋅i=1∏rf(yi∣xi,μ0,μ1,σ2,π)i=1∏nπxi(1−π)1−xi⋅i=1∏r(2πσ2
1exp{−2σ2(yi−μ1)2})xi⋅(2πσ2
1exp{−2σ2(yi−μ0)2})1−xi
同样对上式求对数与偏导,使其等于
0,可解得:
π^=μ1^=μ0^=σ2^=n∑i=1nxi∑i=1rxi∑i=1rxiyi∑i=1r(1−xi)∑i=1r(1−xi)yir∑i=1ryi2−r∑i=1r(1−xi)[∑i=1r(1−xi)yi]2−r∑i=1rxi(∑i=1rxiyi)2
同前面无缺失的情况,
Y边际均值的估计为:
(1−π^)μ0^+π^μ1^
边际方差的估计为:
(1−π^)2σ2^+π^2σ2^
同样将前面的带缺失数据的极大似然估计得到的参数带入即可。
c)从后验分布中生成参数
后验分布:
∝∝f(μ0,μ1,σ2,π∣X,Yobs)f(X,Yobs∣μ0,μ1,σ2,π)⋅f(μ0,μ1,σ2,π)i=1∏nπ21+xi(1−π)23−xi⋅i=1∏r(2πσ2
1exp{−2σ2(yi−μ1)2})xi⋅(2πσ2
1exp{−2σ2(yi−μ0)2})1−xi
我们可以类似书上的141页进行参数任意函数
gd的生成:
- 从参数为
(2n+∑i=inxi+1,23n−∑i=inxi+1)的Beta分布中抽取
bt;从自由度为
2n−2的卡方分布中抽取
xt;从标准正态分布中抽取相互独立的
z0与
z1;
- 计算
ϕ(d)=(π(d),μ1(d),μ0(d),σ2(d)):(其中
σ2^,μ1^,μ0^均为上一问所求)
π(d)σ2(d)μ1(d)μ0(d)=bt=nσ2^/xt=μ1^+z0(σ2(d)/i=1∑rxi)1/2=μ0^+z1(σ2(d)/i=1∑r(1−xi))1/2