Mann-whitney 检验算法学习

Mann-whitney 检验算法

1、Mann-whitney 算法简介

曼-惠特尼U检验又称“曼-惠特尼秩和检验”,是由H.B.Mann和D.R.Whitney于1947年提出的 [1] 。它假设两个样本分别来自除了总体均值以外完全相同的两个总体,目的是检验这两个总体的均值是否有显著的差别。

2、Mann-whitney 算法步骤

具体步骤如下:
第一步: 将两组数据混合,并按照大小顺序编排等级。最小的数据等级为 1,第二小的数据 等级为 2,以此类推(若有数据相等的情形,则取这几个数据排序的平均值作为其等级)。
第二步: 分别求出两个样本的等级和 W1、 W 2。
第三步: 计算曼 -惠特尼 U 检验统计量, n1 为第一个样本的量, n2 为第二个样本的量:
这里写图片描述
选择 U1 和 U2 中最小者与临界值 Ua比较,当 U < Ua 时,拒绝 H0,接受 H1。在原假设为真的情况下, 随机变量 U 的均值和方差分别为,当 n1 和 n2都不小于 10 时,随机变量近似服从正态分布:
这里写图片描述
第四步: 作出判断。设第一个总体的均值为 μ 1,第二个总体的均值为 μ 2,则有:
这里写图片描述

3、时空扫描举例分析

假设一个区域A分成n个子区域s1,s2….sn,如下图,A区域各空间位置病例表示为 x1,x2 … xn,将病例数从小到大排列为这里写图片描述,用 Rj 表示病例数 xj 所在的秩数这里写图片描述,根据Mann-whitney 检验算法,由【si , sj】区域计算其所包含的病例数的秩和,如:
这里写图片描述
其【si , sj】区域均值和方差表示为这里写图片描述这里写图片描述,中心极限定理得到其秩和可化解为:这里写图片描述。以此可取其最大值表示为聚集性可能性最高的区域这里写图片描述,最小值表示为聚集性可能性最低的区域这里写图片描述

猜你喜欢

转载自blog.csdn.net/qq_34734303/article/details/80296316