UA MATH566 统计理论4 贝叶斯统计基础1

UA MATH566 统计理论4 贝叶斯统计基础1

这一讲讨论贝叶斯统计的一些基础思想,会分成三个部分,第一部分讨论贝叶斯统计的设定;第二部分讨论贝叶斯统计的估计与假设检验;第三部分讨论贝叶斯统计的置信区间。

贝叶斯公式

假设 X X 是概率空间 ( X , B ( X ) , P θ ) (\mathcal{X},\mathcal{B}(\mathcal{X}),P_{\theta}) 上的随机变量, X R n \mathcal{X} \subset \mathbb{R}^n ,它表示一组简单随机样本 X 1 , , X n f ( x θ ) X_1,\cdots,X_n \sim f(x|\theta) θ \theta 是分布的参数, θ Θ \theta \in \Theta Θ \Theta 被称为参数空间。参数空间与其Borel σ \sigma -代数构成一个可测空间 ( Θ , B ( Θ ) ) (\Theta,\mathcal{B}(\Theta)) ,用 C a p ( Θ , B ( Θ ) ) Cap(\Theta,\mathcal{B}(\Theta)) 表示参数空间上所有可能的概率测度的集合,对于 P π C a p ( Θ , B ( Θ ) ) P_{\pi} \in Cap(\Theta,\mathcal{B}(\Theta)) ,称测度 P π P_{\pi} 导出的密度为参数 θ \theta 的一个先验密度,记为 π ( θ ) = P π ( d θ ) / d θ \pi(\theta) = P_{\pi}(d \theta)/d \theta ,它与 f ( x θ ) f(x|\theta) 共同决定参数与样本的联合密度:
f ( x , θ ) = f ( x θ ) π ( θ ) f(x,\theta) = f(x|\theta)\pi(\theta)
给定一组样本,参数的后验密度是
π ( θ x ) = f ( x , θ ) f ( x ) = f ( x θ ) π ( θ ) Θ f ( x θ ) π ( θ ) d θ f ( x θ ) π ( θ ) \pi(\theta|x) = \frac{f(x,\theta)}{f(x)} = \frac{f(x|\theta)\pi(\theta)}{\int_{\Theta }f(x|\theta)\pi(\theta)d\theta} \propto f(x|\theta)\pi(\theta)
这个公式叫贝叶斯公式, f ( x θ ) π ( θ ) f(x|\theta)\pi(\theta) 叫后验密度的核,根据这个可以确定 θ \theta 的分布形式。

例1 假设一个硬币掷出数字的概率是 p p ,掷出头像的概率是 1 p 1-p ,如果 p p 的先验是 b e t a ( 3 , 3 ) beta(3,3) ,重复30次试验掷出了16个正面,估计这个硬币掷出正面的概率。

例2 一组简单随机样本 X 1 , , X n N ( θ , σ 2 ) X_1,\cdots,X_n \sim N(\theta,\sigma^2) θ N ( μ , 1 / λ 0 ) \theta \sim N(\mu,1/\lambda_0) ,求 θ \theta 的后验分布。

贝叶斯充分统计量

称统计量 T ( X ) T(X) 为贝叶斯充分统计量,如果 P π C a p ( Θ , B ( Θ ) ) \forall P_{\pi} \in Cap(\Theta,\mathcal{B}(\Theta))
π ( θ x ) = π ( θ T ( x ) ) \pi(\theta|x) = \pi(\theta|T(x))
即后验分布可以表示成 θ \theta T ( x ) T(x) 的函数。

定理 如果 T ( X ) T(X) 是充分统计量,则 T ( X ) T(X) 是贝叶斯充分统计量,反之亦然。

证明
1)假设 T ( X ) T(X) 是充分统计量,先用贝叶斯公式,然后用Fisher-Neyman定理
π ( θ x ) = f ( x θ ) π ( θ ) Θ f ( x θ ) π ( θ ) d θ = h ( x ) g ( θ , T ( x ) ) π ( θ ) Θ h ( x ) g ( θ , T ( x ) ) π ( θ ) d θ = g ( θ , T ( x ) ) π ( θ ) Θ g ( θ , T ( x ) ) π ( θ ) d θ \pi(\theta|x) = \frac{f(x|\theta)\pi(\theta)}{\int_{\Theta }f(x|\theta)\pi(\theta)d\theta} = \frac{h(x)g(\theta,T(x))\pi(\theta)}{\int_{\Theta }h(x)g(\theta,T(x))\pi(\theta)d\theta}=\frac{g(\theta,T(x))\pi(\theta)}{\int_{\Theta }g(\theta,T(x))\pi(\theta)d\theta}
显然后验是只与 θ \theta T ( x ) T(x) 有关的,因此 T ( X ) T(X) 是贝叶斯统计量;
2)假设 T ( X ) T(X) 是贝叶斯充分统计量,根据贝叶斯公式,
π ( θ x ) = f ( x , θ ) f ( x ) = f ( x θ ) π ( θ ) f ( x ) f ( x θ ) = π ( θ x ) f ( x ) π ( θ ) = f ( x ) π ( θ T ( x ) ) π ( θ ) \pi(\theta|x) = \frac{f(x,\theta)}{f(x)} = \frac{f(x|\theta)\pi(\theta)}{f(x)} \Rightarrow f(x|\theta) = \frac{\pi(\theta|x)f(x)}{\pi(\theta)} = f(x)\frac{\pi(\theta|T(x))}{\pi(\theta)}
其中 f ( x ) f(x) 只与样本有关, π ( θ T ( x ) ) π ( θ ) \frac{\pi(\theta|T(x))}{\pi(\theta)} 只与 θ \theta T ( x ) T(x) 有关,根据Fisher-Neyman定理, T ( X ) T(X) 是充分统计量。

猜你喜欢

转载自blog.csdn.net/weixin_44207974/article/details/105003959