UA MATH566 统计理论4 贝叶斯统计基础1
这一讲讨论贝叶斯统计的一些基础思想,会分成三个部分,第一部分讨论贝叶斯统计的设定;第二部分讨论贝叶斯统计的估计与假设检验;第三部分讨论贝叶斯统计的置信区间。
贝叶斯公式
假设
X是概率空间
(X,B(X),Pθ)上的随机变量,
X⊂Rn,它表示一组简单随机样本
X1,⋯,Xn∼f(x∣θ),
θ是分布的参数,
θ∈Θ,
Θ被称为参数空间。参数空间与其Borel
σ-代数构成一个可测空间
(Θ,B(Θ)),用
Cap(Θ,B(Θ))表示参数空间上所有可能的概率测度的集合,对于
Pπ∈Cap(Θ,B(Θ)),称测度
Pπ导出的密度为参数
θ的一个先验密度,记为
π(θ)=Pπ(dθ)/dθ,它与
f(x∣θ)共同决定参数与样本的联合密度:
f(x,θ)=f(x∣θ)π(θ)
给定一组样本,参数的后验密度是
π(θ∣x)=f(x)f(x,θ)=∫Θf(x∣θ)π(θ)dθf(x∣θ)π(θ)∝f(x∣θ)π(θ)
这个公式叫贝叶斯公式,
f(x∣θ)π(θ)叫后验密度的核,根据这个可以确定
θ的分布形式。
例1 假设一个硬币掷出数字的概率是
p,掷出头像的概率是
1−p,如果
p的先验是
beta(3,3),重复30次试验掷出了16个正面,估计这个硬币掷出正面的概率。
例2 一组简单随机样本
X1,⋯,Xn∼N(θ,σ2),
θ∼N(μ,1/λ0),求
θ的后验分布。
贝叶斯充分统计量
称统计量
T(X)为贝叶斯充分统计量,如果
∀Pπ∈Cap(Θ,B(Θ)),
π(θ∣x)=π(θ∣T(x))
即后验分布可以表示成
θ与
T(x)的函数。
定理 如果
T(X)是充分统计量,则
T(X)是贝叶斯充分统计量,反之亦然。
证明
1)假设
T(X)是充分统计量,先用贝叶斯公式,然后用Fisher-Neyman定理
π(θ∣x)=∫Θf(x∣θ)π(θ)dθf(x∣θ)π(θ)=∫Θh(x)g(θ,T(x))π(θ)dθh(x)g(θ,T(x))π(θ)=∫Θg(θ,T(x))π(θ)dθg(θ,T(x))π(θ)
显然后验是只与
θ和
T(x)有关的,因此
T(X)是贝叶斯统计量;
2)假设
T(X)是贝叶斯充分统计量,根据贝叶斯公式,
π(θ∣x)=f(x)f(x,θ)=f(x)f(x∣θ)π(θ)⇒f(x∣θ)=π(θ)π(θ∣x)f(x)=f(x)π(θ)π(θ∣T(x))
其中
f(x)只与样本有关,
π(θ)π(θ∣T(x))只与
θ和
T(x)有关,根据Fisher-Neyman定理,
T(X)是充分统计量。