在阅读前，建议看：t检验、t分布、t值
先深入理解 $t$ 检验、 $t$ 分布、 $t$ 统计量的数学意义

在编程的时候，不少语言或者编程包只有现成的双侧T检验的函数，我想知道怎么根据双侧T检验的 $p$ 值来得到单侧T检验的 $p$ 值。或者更广一点来说，单侧T检验 $p$ 值与双侧T检验的 $p$ 值是什么关系？

双侧T检验

零假设 $H 0 : μ = 0$ ，对立假设 $H 1 : μ \neq = 0$ 。

简单理解：
我们假设了 $H 0 : μ = 0$ ，并要去检验此假设下H0成立的概率高不高。
因为是双侧，如下图所示，只要算出来的 $t$ 统计量- $t s c o r e$ 在95%的区域中，都是能够证明H0成立的。

$P - v a l u e$

在原假设为真时，检验统计量的观察值>=其计算值的概率：
双侧检验为分布中两侧的面积之和
$P$ 越小，拒绝 $H 0$ 的理由越充分。 $P$ 可看作 $H 0$ 是正确的概率，或拒绝了 $H 0$ 会犯错的概率，所以 $P$ 越小说明，犯错的风险越小。
对某一给定的样本， $P$ 越小，说明犯第一类错误（弃真）的概率越小，如果 $P < = α （可接受的最大第一类错误风险）$ ，则拒绝原假设 $H 0$ ；相反如果 $P > α$ ，则认为第一类错误（弃真）的风险太大，于是接受原假设 $H 0$ 。
决策规则： $P < α$ ，拒绝 $H 0$

单侧T检验

零假设 $H 0 : μ < = 0$ ，对立假设 $H 1 : μ > 0$ 。

简单理解：
我们假设了 $H 0 : μ < = 0$ ，并要去检验此假设下H0成立的概率高不高。
因为是右侧检验（拒绝域在右边），如下图所示，只要算出来的 $t$ 统计量- $t s c o r e$ 在95%的区域中，都是能够证明H0成立的。

零假设 $H 0 : μ > = 0$ ，对立假设 $H 1 : μ < 0$ 。

简单理解：
我们假设了 $H 0 : μ > = 0$ ，并要去检验此假设下H0成立的概率高不高。
因为是左侧检验（拒绝域在左边），如下图所示，只要算出来的 $t$ 统计量- $t s c o r e$ 在95%的区域中，都是能够证明H0成立的。

单尾、双尾T检验的p值关系

$双侧检验的 p 值 = 双侧分布中两端面积的总和$

Excel-TDIST函数

在Excel中使用TDIST函数 计算 $p 值$ :

$TDIST(x,degrees_freedom,tails)$

X：为需要计算分布的数字。
Degrees_freedom：为表示自由度的整数。
Tails：指明返回的分布函数是单尾分布还是双尾分布。如果 tails = 1，函数 TDIST 返回单尾分布。如果 tails = 2，函数 TDIST 返回双尾分布。

TDIST函数适用于：Excel2003、Excel2007、Excel2010、Excel2013、Excel2016。

如果任一参数为非数值型，函数 TDIST 返回错误值 #VALUE!。
如果 degrees_freedom < 1，函数 TDIST 返回错误值 #NUM!。
参数 degrees_freedom 和 tails 将被截尾取整。
如果 tails 不为 1 或 2，函数 TDIST 返回错误值 #NUM!。
如果 x < 0，TDIST 返回错误值 #NUM!。 当 x < 0 时要使用 TDIST:
$T D I S T (- x, d f, 1) = 1 - T D I S T (x, d f, 1) = P (X > - x)$
$T D I S T (- x, d f, 2) = T D I S T (x, d f, 2) = P (∣ X ∣ > x)$ 。
如果 tails = 1， $T D I S T = P (X > x)$ ，其中 X 为服从 t 分布的随机变量。
如果 tails = 2， $x\ or\ X < -x)$ 。

上述第5-7点对于x<0时的p值讨论，针对左侧检验和右侧检验都是一样的，同样适用！

TDIST函数 计算可知：

$\ or\ X < -x)$
当 $t$ 统计量>0时， $p 单侧 = p 双侧 / 2 = P (X > x)$
当 $t$ 统计量<0时， $p 单侧 = 1 - p 双侧 / 2 = P (X > - x)$

在这里插入图片描述

Python-ttest等函数

$H 0 : μ = μ 0 ， H 1 : μ \neq = μ 0$

T检验涉及的函数：ttest_1samp进行双侧检验

# 导入包
from scipy import stats
import numpy as np

# 1.单一样本T检验-ttest_1samp
# step1:生成数据,生成50行×2列的数据
np.random.seed(120) # seed 保证每次运行得到的结果是一样的

rvs=stats.norm.rvs(loc=41000,scale=5000,size=20) # 均值为5，方差为10，50行×2列的数据

# step2：检验两列数的均值差异是否显著
stats.ttest_1samp(rvs,40000)

返回结果 ：Ttest_1sampResult(statistic=2.481538955443869, pvalue=0.02260211710111142)

此处的 $t$ 统计量statistic=2.481538955443869, $p 双侧$ pvalue=0.02260211710111142

$t$ 统计量在双尾和单尾检测中的区别：

$t$ 统计量不管是双尾检验还是单尾检验，算出来的 $t$ 值都是一样的，唯一的区别在于双尾中的是 $∣ t ∣$ ,而单尾中的 $t$ 是包含+、-符号的。
另一区别在于，查 $t$ 分布表得出的临界值是不一样的。
双尾查的是 $t - α / 2 (d f)$ ，对比的是 $p 双侧$ 和 $t - α / 2 (d f)$ ；
单尾查的是 $t - α (d f)$ ，对比的是 $p 单侧$ 和 $t - α (d f)$
1)当 $t$ 统计量>0时， $p 单侧 = p 双侧 / 2 = P (X > x)$
2)当 $t$ 统计量<0时， $p 单侧 = 1 - p 双侧 / 2 = P (X > - x)$

更多应用：【DA】常见的假设检验

总结

单侧检验和双侧检验是等价的。没有谁更严格之说。

选择单尾和双尾检验时，就先根据实际问题确定正确的H0和H1，这样验证的思路也会更清晰。

实际上，同一个单尾检验问题，根据关注点的不同（提问方向的不同），既可以用左侧检验，也可以用右侧检验。两种检验得到的 $t$ 统计量的值是一样的，区别在于拒绝域在哪一侧。

【DA】单侧T检验p值与双侧T检验p值的关系

双侧T检验

单侧T检验

单尾、双尾T检验的p值关系

Excel-TDIST函数

Python-ttest等函数

总结

猜你喜欢