统计学习(四):多重检验与控制程序

多重检验

多重检验( Multiple Testing )也称多重比较( Multiple Comparisons ), 即同时检验多个假设。假设有 m 个检验,记为 H1,H2,,Hm . 称检验是显著的( significant ), 如果拒绝零假设;否则,称检验是不显著的( non-significant ). 下表定义不同类型的错误:

/ 零假设为真 备择假设为真 总计
significant V S R
non-significant U T mR
总计 m0 mm0 m

其中, m 是检验个数, m0 是真的零假设个数(未知参数), mm0 是真的备择假设个数。 V 是假阳性( false positives, Type I error )数,也称假发现( false discoveries )。 S 是真阳性( true positives )数,也称真发现。 U 是真阴性( true negatives )数, T 是假阴性( false negatives, Type II error )数。 R=V+S 是拒绝零假设的个数,也称发现( discoveries ). 在 m 个检验中, m0 是真的零假设数, R 是可观测的随机变量, S,T,U,V 不可观测。

例子: 一个人声称某硬币质地不均匀,如果扔10次结果至少有9次正面朝上。检验

H0:H1:

PH0(109)=(109)(12)912+(1010)(12)10=0.0107 , 在 α=0.05 水平下,拒绝 H0 , 即该硬币是不均匀的。
下面检验多枚硬币的均匀性,不妨设100枚硬币。一个均匀硬币掷10次至少出现9次正面的概率是0.0107, 那么100枚硬币被认为是均匀的概率为 (10.0107)1000.34 . 因此,单个检验的均匀准则应用于多个检验时,更可能假发现至少一个(概率是1-0.34=0.66). 这个例子说明重检验提高了 Type I error rate.

称至少犯一次错误,即一个假阳性的概率为 family-wise error rate(FWER), 记为 α¯ , 即

α¯=1(1α)m

如果不假设各检验独立,则由 Boole 不等式,有 α¯kα .

控制程序

这里讨论控制 FWERα¯ 的方法。

  • Bonferroni Correction

αpertest=α¯m , 该方法不假定分布和检验的独立性。

假设 H1,H2,,Hm 是一族检验, p1,p2,,pm 为对应的 p-values,
FWER 为拒绝至少一个真实的 Hi 的概率,即犯至少一次 Type I error.

Bonferroni 校正拒绝零假设,若 piαm,i=1,2,,m . 因为

FWER=P{i=1m0(piαm)}i=1mP{piαm}m0αmα

注意:该方法不需要假定 p-values 之间的关系。但它是相当保守的,即它试图使你甚至不犯一次假发现的错误。更合理的办法是控制假发现率( false discovery rate, FDR ).

  • 控制假发现率

FDR 用来控制假发现,即不正确地拒绝零假设的期望比例。定义

FDR=E(VR)=E(VV+S)

定义 VR=0 , 如果 R=0 .

Benjamini-Hochberg 程序控制 FDR 在水平 α 以下,具体地:

(1). 设有 m 个检验 H1,H2,,Hm , 对应 p-Values p1,p2,,pm , 排序为
p(1)p(2)p(m)

(2). 给定 α , 找到最大的 k , 使得 p(k)kmα

(3). 拒绝所有的 H(i),i=1,2,,k

BH 校正满足: E(Q)m0mαα .

阅读更多精彩内容,请关注微信公众号“统计学习与大数据”!

猜你喜欢

转载自blog.csdn.net/wong2016/article/details/73798286