检验

基于16s测序的差异分析无外乎就是物种差异,α 多样性差异以及β 多样性差异分析。最多,也就是基于PICRUSt,BUGBASE这类型的软件预测完功能后,再做一些功能差异分析。

常见的差异检验方法,可以分为两大类,一类是最基本的差异检验方法,只输出p值,例如t检验,秩和检验等。另外一类是可以输出p值的同时,也可以输出R值,如Anosim,Adonis等。下面来简单介绍一下这些方法。

01. 基本检验方法

对于只输出p值的检验方法,它的目的很简单,就是检验比较组之间的相似性距离是否有差异,从而反映出不同环境对群落结果的影响是否有作用。常用的分析方法有卡方检验、Student t检验、Wilcoxon秩和检验等等。

如果只有两个样本比较,适合用卡方检验,不过说实在的,检验出来的结果没什么可靠性,因为现阶段16s研究不做重复实在“难以服众”了。先不说价格便宜,做重复压根没有难度,就是从生物学、统计学角度考虑,也需要做重复,详情可参考之前的文章《浅聊多样性测序样本重复问题》。

如果是两组样本(至少3重复),可以试一下Student t,Welch‘st以及Wilcoxon秩和检验。Student t检验需要样本符合正态分布,而且方差对齐。当组间样本数不同,方差也不对齐的时候,Welch’s t检验是很好的选择。

Wilcoxon秩和检验又叫Mann-Whitney U 检验,是基于变量排名的一种统计方法,不需要样本符合正态分布,也不需要样本方差对齐,是更为广泛的检验方法,但同时也由于检验太宽松,容易带来很多假阳性。

如果是多组样本比较,可以选择one way ANOVA、TURKEY以及Kruskal-Wallis H检验等方法。one way ANOVA和TURKEY其实都是基于方差分析,只不过后者带有后验,可以知道两个分组对整体差异的贡献度。

Kruskal-Wallis H检验本质也是一种秩和检验,与前两者的区别在于,它不需要样本数和方差的对齐,应用更为广泛。

这些方法哪种较好?这是个见仁见智的问题,如果在不确定数据模型的情况下,建议都可以试一下,毕竟也就是一行命令的问题

02. 基于矩阵的检验方法

上面所提及的检验方法,其实都只能告诉大家,这些分组是否有显著差异(可以简单理解为有无)。那如果想同时知道这些差异的程度(可以简单理解为多少)呢,那需要Anosim,Adonis以及MRPP等检验方法。

这些方法不单可以输出检验显著性结果(p值),还有程度结果(R值),R值可以用来判断分组贡献度大小。

举个例子,微生物生长受N、P等多种因素影响。如果有3组样本,分别是对照、N处理以及P处理的土壤,在N和P处理相对于对照都显著(p<0.05)的情况下,想知道到底是N还是P的处理更为重要,那就是要看之前R值大小了。

Anosim

Anosim(Analysis of similarities)是一种非参数检验方法。它首先通过变量计算样本间关系(或者说相似性),然后计算关系排名,最后通过排名进行置换检验判断组间差异是否显著不同于组内差异。

这个检验有两个重要的数值,一个是p值,可以判断这种组间与组内的比较是否显著;一个是R值,可以得出组间与组内比较的差异程度。

R值范围实际范围是(-1,1),但一般介于(0,1)之间,R>0,说明组间存在差异,一般R>0.75:大差异;R>0.5:中等差异,R>0.25:小差异。 R等于0或在0附近,说明组间没有差异。R偶尔也会<0,这种情况是组内差异显著大于组间差异,这就说明我们的采样或者分组出现大问题,可以认为是无效数据(怎么办?重做实验啊!)。

Anosim原理(左图相似性,右图为关系排名)

Adonis

Adonis,这名字挺陌生的,但它其实就是大名鼎鼎的PERMANOVA,大家又熟悉起来了吧。它与Anosim的用途其实差不多,也能够给出不同分组因素对样品差异的解释度(R值)与分组显著性(P值)。

不同点是应用的检验模型不同,ADONIS本质是基于F统计量的方差分析,所以很多细节与上述方差分析类似。

MRPP

至于MRPP,其实与上述两个差不多,只不过它所使用的模型是基于delta统计量的检验方法,详细内容就不细说了。

03. 应用情况

很多时候,我们做完PCoA,NMDS之后,虽然肉眼能大概分辨分组是否可以清晰分开,但实际上,严谨的统计学还是需要检验的,说明白这所谓的“清晰分开”到底显著不显著。

Anosim、Adonis这些可用于多元统计检验的模型就非常适合了。要值得注意的是,Anosim本质是基于排名的算法,其实与NMDS的配合效果最好。如果是PCoA分析,建议配合使用Adonis检验结果。

NMDS配合Anosim展示结果[1]

PcoA配合使用Adonis(PERMANOVA)分析[2]

04. 小 结

上面唠叨了一大堆,可以总结为几点:

a.第一小点所提及的T检验等只能分辨差异是否显著,只有第二小点所提及的Anosim等方法才能有差异程度的评价。

b.Anosim,Adonis(PERMANOVA)以及MRPP只是不同模型,基本上都需要配合PCoA等多元分析方法一起使用。Anosim与NMDS更配,Adonis与PCoA更配。

c. 这些检验方法,不是beta多样性分析特有,它们能用于任何情况下的分析,只不过有一些是基于原始丰度数据,有一些是基于距离关系,有一些是基于排名等等。要注意的是它们的分析条件,不是分析对象。

猜你喜欢

转载自www.cnblogs.com/HISAK/p/11961447.html