你需要了解的群体重测序都在这里(一)

背景介绍

        分子群体遗传学是当代进化生物学研究的支柱学科, 也是遗传育种和关于遗传关联作图和连锁分析的基础理论学科。分子群体遗传学是在经典群体遗传的基础上发展起来的, 利用大分子主要是DNA序列的变异式样来研究群体的遗传结构及引起群体遗传变化的因素与群体遗传结构的关系, 从而使得遗传学家能够从数量上精确地推知群体的进化演变, 不仅克服了经典的群体遗传学通常只能研究群体遗传结构短期变化的局限性, 而且可检验以往关于长期进化或遗传系统稳定性推论的可靠程度。同时, 对群体中分子序列变异式样的研究也使人们开始重新审视达尔文的以“自然选择”为核心的进化学说。

如下图所示:

图1 基因等位基因频率说明

                         

基本统计量

PIC多态信息含量

PIC polymorphism information content,在连锁分析中一个遗传标记多态性可提供的信息量的度量。它是一个亲本为杂合子,另一亲本为不同基因型的概率。现常用来衡量座位多态性高低的程度。指示群体中SNP遗传特性。

期望杂合度

杂合度(heterogosity,He)也称为基因多样性,它是指在一个多态位点,一随机个体含有任意两个不相同等位基因的可能性,即为杂合子的可能性,Hexp/Hs表示群体的期望杂合度。

平均观测杂合度

Ho/Hi,在所观测的座位上杂合子的数量占所有检测座位的比例

Fis

是Ho相对于He减少量的比值,即一个种群的平均近交系数

Fis可当做一个种群内个体之间的近亲交配程度指标

如果Ho=He,则Fis=0,群体为随机交配

如果Ho<He,则Fis >0,近亲交配

如果Ho>He,则Fis<0,远亲生殖

香农多样性指数

 又称香农-维纳多样性指数(Shannon’s diversity index)是生态学中常用的指标。它基于克劳德·香农的熵公式,估计等位基因位点的多样性指数

ρ表示基因型频率

Ae

有效等位位点数量(effective number of alleles) 

n表示标记数量,Hexp表示每个标记的期望杂合度

Nei氏多样性指数

Nei's-gene-diversity 是指通过计算遗传距来分析遗传多样性的,即通过计算单倍型多样性指数来计算群体间的核苷酸序列歧化距离。

HWE

哈迪一温伯格平衡定律((Hardy-Weinberg equilibrium,HWE)亦称遗传学平衡定律,是群体遗传学中最重要的原理,是群体有性繁殖上下代之间基因频率与基因型频率是否保持平衡的检验尺度。这个法则是用 Hardy,G.H(英国数学家)和Weinberg,W(德国医生)两位学者的姓来命名的,他们于同一年(1908 年)各自发现了这一法则。他们提出在一个不发生突变、迁移和选择的无限大的随机配的群体中,基因频率和基因型频率将逐代保持不变。哈迪-温伯格平衡定律可分为 3 个部分:第一部分是假设:在一个无穷大的随机交配的群体中,没有进化的压力(突变、迁移和自然选择);第二部分是基因频率逐代不变;第三部分:随机交配一代以后基因型频率将保持平衡:p 表示AA 的基因型的频率,2pq 表示 Aa 基因型的频率,q 表示 aa 基因型的频率。其中 p 是 A 基因的频率;q 是 a 基因的频率。基因型频率之和应等于 1,即p²+2pq+q²=1。

        其中O表示观测值,E表示期望值,哈迪一温伯格平衡检验符合自由度2的卡方分布

举例说明

输入数据格式:

输出结果格式:

经典文献解读

       本研究材料是来源于珍珠粟(Pennisetum glaucum)自交种质资源库(PMiGAP)的250个自交系,将250份材料分配到4个早熟组(早期、中早期、中期和晚期成熟组)进行干旱胁迫处理。对16种形态、形态生理和农艺性状进行了评价,分别为粮食产量(GY)、穗产率(PY)、穗收获指数(PHI)、开花至75%时间(FT)等。

       采用37个SSR和CISP标记对PMiGAP进行基因分型,同时利用17个主要已验证的耐旱性(DT)QTL基因的SNPs和InDels进行基因分型,并与物种性状进行关联分析。

        结果表明,PMiGAP的平均Nei’s遗传多样性指数为0.54。STRUCTURE分析显示,ΔK在K=6时显示出最高的峰值,PMiGAP的250份资源材料被分为6个亚群。

        用17个基因中的39个SNPs和7个InDel标记对PMiGAP进行基因分型。在17个候选基因的9487 bp测序区中,共鉴定出251个SNP,平均每38 bp有1个SNP。不同处理下13个基因的22个SNPs和3个InDels之间有显著相关性(P<0.05)。在灌溉和干旱胁迫处理之一条件下,来自5个基因的7个SNPs关联是常见的。最显著的是,乙酰辅酶a羧化酶基因中的一个重要SNP在所有处理下均与籽粒产量、籽粒收获指数和穗产量存在构成性关联。叶绿素a/b结合蛋白基因的InDel与干旱胁迫下的滞绿性和籽粒产量性状显著相关。这可以作为在干旱胁迫下选择具有“滞绿性”表型的高产基因型的功能标记。

        本研究鉴定了灌溉和干旱胁迫条件下重要农艺性状与已验证的主要DT-QTL基因的标记性状关联,调查了PMiGAP中的遗传多样性和结构,并探索了其在关联分析中的潜力。研究表明在PMiGAP中获得了高度的遗传多样性和适度的遗传结构,非常适合进行关联分析。

图2 基于模型的STRUCTURE分析中的ΔK值

图3 基于37个SSR和CISP标记(K=6)的PMiGAP群体结构Structure分析

表1 6个亚群体的平均观察等位基因数(A)、有效等位基因数(Ae)、Shannon指数(I)、观察和预期杂合度(Ho和He)和特有等位基因(Private alleles)

图4 干旱胁迫下籽粒产量与卷叶和滞绿性

(a)籽粒产量与卷叶和开花时间的等高线图(b)干旱胁迫下滞绿性(c)和卷叶(d)对粮食产量的影响

图5 候选基因的基因内连锁不平衡

       平方相关系数(r2)值在上面的三角形中从白色(0.0)到红色(1.0)的颜色尺度表示。p值的范围从不显著(0.01;白色)到高度显著(<0.0001;红色)显示在下面的三角形中。(1.尿苷酸激酶2.酰基辅酶a氧化酶3.锌指CCCH型4.泛素偶联酶5.肌动蛋白解聚因子6.光敏色素 7.二肽基肽酶IV8 8.丝氨酸羧基肽酶 9.丝氨酸/苏氨酸蛋白激酶10.磷酸甘油酸激酶11.Chl a/b结合蛋白12.过氧化氢酶13.丙氨酸乙二醛酸转氨酶和14.光解酶)

猜你喜欢

转载自blog.csdn.net/SHANGHAILINGEN/article/details/124271771#comments_21673616