在学习统计学贾书的过程,在第6—14章节出有许多需要理解与记忆的公式和概念,在此通过博客的形式做一次梳理,主要内容为统计学中抽样分布、假设检验、参数估计、分类数据分析、方差分析、一元二元线性分析、时间序列分析、指数的理论知识,不足之处望多多指正。
1.假设检验的基本问题
- 两类错误判别
(1)第一类:拒真;第一类错误的概率为 α \alpha α即为显著水平
(2)第二类:去伪;(原假设为假时接受原假设;第二类错误的概率为 β \beta β) - 假设检验的流程
(1)提出假设
(2)确定适当的检验统计量
(3)规定显著性水平 α \alpha α
(4)计算检验统计量的值
(5)作出统计决策 - 利用P值进行决策
(1)双侧检验的P值决策
(2)左侧检验的P 值
(3)右侧检验的P 值
- 双侧检验与单侧检验的使用场景
2.一个总体参数的检验
- 使用场景
(双尾与单尾即双侧检验与单侧检验,Z分布、t分布判定同前文参数估计)
2.1.一个均值检验
- 检验统计量计算公式:
2.2一个总体比例的检验
-
假设条件
(1)有两类结果;
(2)总体服从二项分布;
(3)可用正态分布来近似。 -
检验统计量的计算公式
z = p − π π ( 1 − π ) n z=\frac{p-\pi}{\sqrt{\frac{\pi(1-\pi)}{n}}} z=nπ(1−π)p−πp为观测概率值 π \pi π为期望的概率值
2.3一个总体方差检验( χ 2 \chi^2 χ2检验)
-
假设条件
(1)一个总体的方差或标准差已知;
(2)假设总体近似服从正态分布 -
检验统计量的计算公式:
χ 2 = ( n − 1 ) s 2 σ 2 \chi^2=\frac{(n-1) s^{2}}{\sigma^{2}} χ2=σ2(n−1)s2
两个总体参数的检验
- 使用场景总结
2.1两个总体均值差的检验
-
假定条件
(1)两个样本是独立的随机样本
(2)两个总体都是正态分布
(3)若不是正态分布, 可以用正态分布来近似(n1>=30和 n2>=30) -
Z检验(大样本或者小样本且 σ 1 2 , σ 2 2 \sigma_{1}^{2},\sigma_{2}^{2} σ12,σ22已知)检验统计量计算公式:
Z = ( X ˉ 1 − X ˉ 2 ) − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 Z=\frac{\left(\bar{X}_{1}-\bar{X}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}} Z=n1σ12+n2σ22(Xˉ1−Xˉ2)−(μ1−μ2) -
t检验(独立样本且 σ 1 2 , σ 2 2 \sigma_{1}^{2},\sigma_{2}^{2} σ12,σ22未知)检验统计量公式:
t = ( X ˉ 1 − X ˉ 2 ) − ( μ 1 − μ 2 ) S p 1 n 1 + 1 n 2 ( σ 1 2 = σ 2 2 ) t = ( X 1 − X 2 ) − ( μ 1 − μ 2 ) S 1 2 n 1 + S 2 2 n 2 ( σ 1 2 ! = σ 2 2 ) t=\frac{\left(\bar{X}_{1}-\bar{X}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{S_{p} \sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}} (\sigma_{1}^{2}=\sigma_{2}^{2}) \quad t=\frac{\left(X_{1}-X_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}(\sigma_{1}^{2}!=\sigma_{2}^{2}) t=Spn11+n21(Xˉ1−Xˉ2)−(μ1−μ2)(σ12=σ22)t=n1S12+n2S22(X1−X2)−(μ1−μ2)(σ12!=σ22) -
t检验(配备样本且 σ 1 2 , σ 2 2 \sigma_{1}^{2},\sigma_{2}^{2} σ12,σ22未知)检验统计量公式:
t = X ˉ D − D 0 S D / n D X ˉ D = ∑ i = 1 n D i n D s D = ∑ i = 1 n ( D i − x ˉ D ) 2 n D − 1 t=\frac{\bar{X}_{D}-D_{0}}{S_{D} / \sqrt{n_{D}}} \bar{X}_{D}=\frac{\sum_{i=1}^{n} D_{i}}{n_{D}} \quad s_{D}=\sqrt{\frac{\sum_{i=1}^{n}\left(D_{i}-\bar{x}_{D}\right)^{2}}{n_{D}-1}} t=SD/nDXˉD−D0XˉD=nD∑i=1nDisD=nD−1∑i=1n(Di−xˉD)2
2.2两个总体比例差检验
- 假定条件
两个总体是独立的;
两个总体都服从二项分布;
可以用正态分布来近似。 - Z检验统计量计算公式
Z = ( P 1 − P 2 ) − ( π 1 − π 2 ) P 1 ( 1 − P 1 ) n 1 + P 2 ( 1 − P 2 ) n 2 Z=\frac{\left(P_{1}-P_{2}\right)-\left(\pi_{1}-\pi_{2}\right)}{\sqrt{\frac{P_{1}\left(1-P_{1}\right)}{n_{1}}+\frac{P_{2}\left(1-P_{2}\right)}{n_{2}}}} Z=n1P1(1−P1)+n2P2(1−P2)(P1−P2)−(π1−π2)
2.3两个总体方差比的检验
- 假定条件
两个总体都服从正态分布,且方差相等
两个独立的随机样本 - 检验统计量计算公式
F = S 1 2 / S 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \mathrm{F}=\mathrm{S_1}^ 2 \mathrm / \mathrm{S_2} ^2 \sim \mathrm{F}(\mathrm{n_1} -1, \quad \mathrm{n_2} -1) F=S12/S22∼F(n1−1,n2−1)
关于参数估计与假设检验的一点点自我总结
书本一开始先让我们了解参数估计怎样用样本的计算观测值作为总体样本的估计值,提出了点估计与区间估计的概念,利用区间估计让真值的估计确定在某一范围里,主要使用场景是单个总体的均值、比例、方差(误差)问题,两个总体的均值差、比例差、方差比(F分布)问题,重在理解和公式得熟练使用。
假设检验章节基于先前参数估计的统计原理,将研究点从估计值的范围估计问题转移到了实际问题的计算观测值是否可以作为估计值的问题上,原理相近,统计思想一致,使用场景解题时需要注意提假设的技巧,即将什么作为原假设的问题同时后者主要在于计算检验统计量,然后与相关显著水平的临界值进行比较后作出决策,并得出相关结论。与参数估计相比,假设检验也要判别问题的检验是单侧还是双侧的问题。(暂时这么多,以后继续动态补充)。
参考
《统计学》 第7版_贾俊平