假设检验(一):假设检验总体概念

写在前面的话:最近在学习统计学,这里仅仅是一些学习笔记,方便我自己回顾以及供大家参考。对于统计学我只是初学者,有什么错误之处欢迎大家指出。共同学习,共同进步~


一、总体概念

假设检验是一种统计推断方法,其主要用来判断样本与样本、样本与总体之间的差异是由于偶然的抽样误差造成的还是由于本质差别造成的。

具体说来就是:当遇到两个或几个样本之间,或者样本与总体之间某些统计量(e.g. X ¯ 、μ)不一致时,可能会有两种情况:
1)这两个样本来自同一总体,但是由于抽样误差这样的偶然性原因造成了不一致。
2)这两个样本来自不同总体,其在本质上就是不同的。

二、其他概念

为了使内容清晰,这里的0与1均不设下标

1)原假设与备择假设

举一个例子:现在有一桩案件,我们需要去检验嫌疑人是否真的犯罪。
原假设——H0:没有犯罪
备择假设—H1:犯罪

我们在建立假设的时候还没有收集数据,我们一般把希望得到的结果(即希望证明的事情)作为备择假设。我们希望的结果就是拒绝原假设,然后得到备择假设里的结论。
一般来说H0假设的内容是大概率的事件,而H1的内容是小概率事件,这样的安排是基于小概率原理。H0假设有时又被称为无效假设。

小概率原理:我们做这样一个假设,假设H0是真实的,那么处于H0对立面的H1假设就是不真实的、不可能发生的小概率事件。要是在一次试验中这么小概率的事件H1竟然发生了,那么我们就有充足的理由怀疑H0的真实性,我们会拒绝H0假设。这是一种类似于反证法的思想。

P值(P-value):H0是真实的的前提下,得到现有样本观察值(e.g. X ¯ )以及更极端的情况出现的概率。

α /显著性水平(Alpha / Significance level):错误判断的概率水平,也就是计算值落在拒绝域的概率水平。1- α 则称为置信水平置信度,指的是计算值落在置信区间的概率。

H0、H1是对总体情况做出的假设,P值是由样本数据计算出来的。下面我们来用样本观察结果对假设做出接受或拒绝的判断。

P <= α 拒绝原假设H0,备择假设H1成立
P > α 无法拒绝原假设H0,H0成立

α 已经固定的时候,为了使H1能成立,我们希望算出来的P越小越好啦
α 还没定的时候, α 越大H1就越容易被认为是成立的
我们可以规定 α =0.05,那么1- α =0.95,也就是说当犯罪的概率>95%时,认为H1成立。可以这么理解,我们认为冤枉一个无辜的人有罪比放掉一个有罪的人更严重,因此我们会默认一个人初始无罪,然后对判断一个人有罪设置严格的标准,因此会将 α 设定成一个很小的值,只有备择假设发生的几率很大时才去推翻原假设。

2)两类错误

第一类:弃真错误 α 。 H0是真的,但是我们拒绝了H0。也就是嫌疑人是无罪的,但是我们认为他有罪。
第二类:取伪错误 β。H0不是真的,但是我们没有拒绝H0。也就是嫌疑人是有罪的,但是我们认为他无罪。

参考文献:
[1] https://cosx.org/2010/11/hypotheses-testing “胡江堂-假设检验初步”

猜你喜欢

转载自blog.csdn.net/weixin_38322363/article/details/81609388
今日推荐