检验 - 代码天地

基于16s测序的差异分析无外乎就是物种差异，α 多样性差异以及β 多样性差异分析。最多，也就是基于PICRUSt，BUGBASE这类型的软件预测完功能后，再做一些功能差异分析。

常见的差异检验方法，可以分为两大类，一类是最基本的差异检验方法，只输出p值，例如t检验，秩和检验等。另外一类是可以输出p值的同时，也可以输出R值，如Anosim，Adonis等。下面来简单介绍一下这些方法。

01. 基本检验方法

对于只输出p值的检验方法，它的目的很简单，就是检验比较组之间的相似性距离是否有差异，从而反映出不同环境对群落结果的影响是否有作用。常用的分析方法有卡方检验、Student t检验、Wilcoxon秩和检验等等。

如果只有两个样本比较，适合用卡方检验，不过说实在的，检验出来的结果没什么可靠性，因为现阶段16s研究不做重复实在“难以服众”了。先不说价格便宜，做重复压根没有难度，就是从生物学、统计学角度考虑，也需要做重复，详情可参考之前的文章《浅聊多样性测序样本重复问题》。

如果是两组样本（至少3重复），可以试一下Student t，Welch‘st以及Wilcoxon秩和检验。Student t检验需要样本符合正态分布，而且方差对齐。当组间样本数不同，方差也不对齐的时候，Welch’s t检验是很好的选择。

Wilcoxon秩和检验又叫Mann-Whitney U 检验，是基于变量排名的一种统计方法，不需要样本符合正态分布，也不需要样本方差对齐，是更为广泛的检验方法，但同时也由于检验太宽松，容易带来很多假阳性。

如果是多组样本比较，可以选择one way ANOVA、TURKEY以及Kruskal-Wallis H检验等方法。one way ANOVA和TURKEY其实都是基于方差分析，只不过后者带有后验，可以知道两个分组对整体差异的贡献度。

Kruskal-Wallis H检验本质也是一种秩和检验，与前两者的区别在于，它不需要样本数和方差的对齐，应用更为广泛。

这些方法哪种较好？这是个见仁见智的问题，如果在不确定数据模型的情况下，建议都可以试一下，毕竟也就是一行命令的问题

。

02. 基于矩阵的检验方法

上面所提及的检验方法，其实都只能告诉大家，这些分组是否有显著差异（可以简单理解为有无）。那如果想同时知道这些差异的程度（可以简单理解为多少）呢，那需要Anosim，Adonis以及MRPP等检验方法。

这些方法不单可以输出检验显著性结果（p值），还有程度结果（R值），R值可以用来判断分组贡献度大小。

举个例子，微生物生长受N、P等多种因素影响。如果有3组样本，分别是对照、N处理以及P处理的土壤，在N和P处理相对于对照都显著（p<0.05）的情况下，想知道到底是N还是P的处理更为重要，那就是要看之前R值大小了。

Anosim

Anosim（Analysis of similarities）是一种非参数检验方法。它首先通过变量计算样本间关系（或者说相似性），然后计算关系排名，最后通过排名进行置换检验判断组间差异是否显著不同于组内差异。

这个检验有两个重要的数值，一个是p值，可以判断这种组间与组内的比较是否显著；一个是R值，可以得出组间与组内比较的差异程度。

R值范围实际范围是（-1，1），但一般介于（0，1）之间，R>0，说明组间存在差异，一般R>0.75：大差异；R>0.5：中等差异，R>0.25：小差异。 R等于0或在0附近，说明组间没有差异。R偶尔也会<0，这种情况是组内差异显著大于组间差异，这就说明我们的采样或者分组出现大问题，可以认为是无效数据（怎么办？重做实验啊！）。

Anosim原理（左图相似性，右图为关系排名）

Adonis

Adonis，这名字挺陌生的，但它其实就是大名鼎鼎的PERMANOVA，大家又熟悉起来了吧。它与Anosim的用途其实差不多，也能够给出不同分组因素对样品差异的解释度（R值）与分组显著性（P值）。

不同点是应用的检验模型不同，ADONIS本质是基于F统计量的方差分析，所以很多细节与上述方差分析类似。

MRPP

至于MRPP，其实与上述两个差不多，只不过它所使用的模型是基于delta统计量的检验方法，详细内容就不细说了。

03. 应用情况

很多时候，我们做完PCoA，NMDS之后，虽然肉眼能大概分辨分组是否可以清晰分开，但实际上，严谨的统计学还是需要检验的，说明白这所谓的“清晰分开”到底显著不显著。

Anosim、Adonis这些可用于多元统计检验的模型就非常适合了。要值得注意的是，Anosim本质是基于排名的算法，其实与NMDS的配合效果最好。如果是PCoA分析，建议配合使用Adonis检验结果。

NMDS配合Anosim展示结果[1]

PcoA配合使用Adonis（PERMANOVA）分析[2]

04. 小结

上面唠叨了一大堆，可以总结为几点：

a.第一小点所提及的T检验等只能分辨差异是否显著，只有第二小点所提及的Anosim等方法才能有差异程度的评价。

b.Anosim，Adonis（PERMANOVA）以及MRPP只是不同模型，基本上都需要配合PCoA等多元分析方法一起使用。Anosim与NMDS更配，Adonis与PCoA更配。

c. 这些检验方法，不是beta多样性分析特有，它们能用于任何情况下的分析，只不过有一些是基于原始丰度数据，有一些是基于距离关系，有一些是基于排名等等。要注意的是它们的分析条件，不是分析对象。

检验

猜你喜欢