数量性状的分子标记(QTL定位的原理和方法讲义)
作物中大多数重要的农艺性状和经济性状如产量、品质、生育期、抗逆性等都是数量性状。与质量性状不同,数量性状受多基因控制,遗传基础复杂,且易受环境影响,表现为连续变异,表现型与基因型之间没有明确的对应关系。因此,对数量性状的遗传研究十分困难。长期以来,只能借助于数理统计的手段,将控制数量性状的多基因系统作为一个整体来研究,用平均值和方差来反映数量性状的遗传特征,无法了解单个基因的位置和效应。这种状况制约了人们在育种中对数量性状的遗传操纵能力。分子标记技术的出现,为深入研究数量性状的遗传基础提供了可能。控制数量性状的基因在基因组中的位置称为数量性状基因座(QTL)。利用分子标记进行遗传连锁分析,可以检测出QTL,即QTL定位(QTL mapping)。借助与QTL连锁的分子标记,就能够在育种中对有关的QTL的遗传动态进行跟踪,从而大大增强人们对数量性状的遗传操纵能力,提高育种中对数量性状优良基因型选择的准确性和预见性。因此,QTL定位是一项十分重要的基础研究工作。1988年,Paterson等发表了第一篇应用RFLP连锁图在番茄中定位QTL的论文。之后,随着分子标记技术的不断发展以及许多物种中分子连锁图谱的相继建成,全世界出现了研究QTL的热潮,每年发表有关QTL研究的论文数量几乎呈指数增长(图5.1),显示了该研究领域的勃勃生机。目前, Q
TL定位研究已在许多重要作物中展开,并且进展迅速。本章主要介绍QTL定位的原理和方法。
图5.1 1986~1998年期间国际上每年发表有关QTL研究的论文的数量. 数据从英国BIDS信息系统检索得到
第一节 数量性状基因的初级定位
QTL定位就是检测分子标记(下面将简称为标记)与QTL间的连锁关系,同时还可估计QTL的效应。QTL定位研究常用的体有F2、BC、RI和DH。这些体可称为初级体(primary
population)。用初级体进行的QTL定位的精度通常不会很高,因此只是初级定位。由于数量性状是连续变异的,无法明确分组,因此QTL定位不能完全套用孟德尔遗传学的连锁分析方法,而必须发展特殊的统计分析方法。80年代末以来,这方面的研究十分活跃,已经发展了不少QTL定位方法。
一、QTL定位的基本原理和方法
孟德尔遗传学分析非等位基因间连锁关系的基本方法是,首先根据个体表现型进行分组,然后根据各组间的比例,检验非等位基因间是否存在连锁,并估计重组率。QTL定位实质上就是分析分子标记与QTL之间的连锁关系,其基本原理仍然是对个体进行分组,但这种分组是不完全的。根据个体分组依据的不同,现有的QTL定位方法可以分成两大类。一类是以标记基因型为依据进行分组的,称为基于标记的分析法(marker-based analysis; Soller and Beckmann 1990);另一类是以数量性状表型为依据进行分组的,称为基于性状的分析法(trait-based analysis;Keightley and Bulfield 1993)。
(一)基于标记的分析法
如果某个标记与某个QTL连锁,那么在杂交后代中,该标记与QTL之间就会发生一定程度的共分离,于是,在该标记的不同基因型中,QTL的基因型频率分布(分离比例)将不同(图5.2),因而在该标记的不同基因型之间,在数量性状的分布、均值和方差上都存在差异。基于标记的分析法正是通过检验标记的不同基因型之间的这些差异来推知标记是否与QTL连锁的。
在分子标记技术出现之前提出的基于标记的分析法主要是针对单标记分析的,即每次只分析一个标记,这是因为当时可利用的遗传标记(主要是形态标记和生化标记)数量稀少,难以在一个试验体中建立起完整的标记连锁图谱。随着高密度分子标记连锁图谱的出现,单标记分析方法暴露出了不能充分利用分子标记图谱所提供的遗传信息的缺点。为了能更好地挖掘分子标记图谱的潜力,更多、更准确地定位出QTL,科学家们相继开发出了许多新的QTL定位方法,总的趋势是朝着多标记分析(即同时用多个标记进行分析)的方向发展。根据所采用的统计遗传模型,现有的基于标记的分析方法大体上可分成四类,即:均值差检验法、性状-标记回归法、性状-QTL回归法及性状-QTL-标记回归法。这些方法的原理将在后面分别介绍。
图5.2 DH体中某QTL的基因型QQ和qq在连锁标记基因型MM和mm中的频率分布(分离比例). r为标记与QTL间的重组率. 仅当r = 0.5(亦即标记与QTL间没有连锁)时, QQ和qq在MM和mm中的频率分布才相同
(二)基于性状的分析法
虽然数量性状在一个分离体(如DH体)中是连续变异的,但如果淘汰大多数中间类型,则高值和低值两种极端表型的个体就可以明确地区分开来,分成两组。对每个QTL而言,
在高值表型组中应存在较多的高值基因型(如QQ),而低值组中应存在较多的低值基因型(如qq;图5.3)。如果某个标记与QTL有连锁,那么,该标记与QTL之间就会发生一定程度的共分离,于是其基因型分离比例(频率分布)在两组中都会偏离孟德尔规律(图5.3)。用卡平方测验方法对两组或其中一组检验这种偏离,就能推断该标记是否与QTL连锁。
图5.3 基于性状的分析法和分离体分组混合分析法的原理. 在DH体中,与QTL连锁的遗传标记的两种基因型的分离比例在高值组和低值组中都会偏离1 : 1的孟德尔分离规律,其电泳带型在高值组DNA和低值组DNA间也会表现出差异, qq分组简单且分别与高值亲本和低值亲本相似
还有一种更简单的做法,就是将高值和低值两组个体的DNA分别混合,形成两个DNA池,然后检验两池间的遗传多态性。在两池间表现出差异的分子标记即被认为与QTL连锁(图5.3)。这种方法称为分离体分组混合分析法(BSA法;Darvasi and Soller 1994;参见第4章)。
基于性状的分析方法(特别是BSA法)的突出优点是,可以大幅度减少需要检测的DNA样品的数量,从而降低分子标记分析的费用。它特别适合于对一些抗性(包括抗病、抗虫、抗逆)性状的基因定位,这是因为,抗性鉴定试验常常造成敏感个体(基因型)的死亡,只有具有抗性的个体才能够存活,于是只能对表现抗的极端个体进行分子标记分析,这正好符合基于性状的分析法。基于性状的分析法的缺点是,它只能用于单个性状的QTL定位,且灵敏度和精确度都较低,一般只能检测出效应较大的QTL。因此,基于性状的分析法目前用得不多,主要还是采用基于标记的分析法。下面着重对基于标记的分析法进行介绍。
二、均值差检验法
均值差检验法的基本思想是检验同一标记座位上不同基因型间数量性状均值的差异,若差异显著,则表明被检标记与QTL连锁。单标记均值差检验法包括t测验法(Simpson 1989)和方差分析法(Soller et al. 1976; 李维明等 1993)。凡是每个标记只有两种基因型的体(包括BC、DH、RI)都可以使用t测验法。以DH体为例,由图5.2可知,当某个标记与一个QTL连锁时,两种标记基因型(MM和mm)的性状均值(μMM和μmm)分别为:
(5.1)
(5.2)
式中,μQQ和μqq分别是QTL基因型QQ和qq的表型均值,r为标记与QTL间的重组率。比较式(5.1)和(5.2)可以看出,仅当r = 0.5,亦即标记与QTL没有连锁时,才有μMM = μmm();而只要r < 0.5,亦即标记与QTL间存在连锁,则总有μMM ≠ μmm。而且,r值越小,标记与QTL间连锁越紧密,则μMM与μmm之间的差异就越大。当r = 0,亦即标记与QTL之间完全连锁时,标记基因型间的均值差异达到最大,这时有μMM - μmm = μQQ - μqq。因此,用t测验方法检验两种标记基因型间的数量性状表型均值差异是否显著,就能推断该标记是否与QTL连锁。t值越大,即显著性越高,则连锁越紧密。
如果体中每个标记存在3种基因型(如F2体),或者尽管体中每个标记只有两种基因型(如DH、RI体),但试验中设置了重复(李维明等 1993),则可以采用方差分析的方法来检测标记与QTL之间的连锁关系。以F2体为例。假设某个标记与一个QTL连锁,采用与图5.2类似的推导方法,可以得到3种标记基因型的性状均值分别为:
(5.3)
(5.4)
(5.5)
式中所用符号的含义与式(5.1)和(5.2)的相似。比较式(5.3) ~ (5.5),可以看出,与上面DH体的情形相似,仅当标记与QTL间的重组率为,亦即标记与QTL间没有连锁时,才有μMM = μMm = μmm();而只要r < 0.5,亦即标记与QTL间存在连锁,则总有μMM ≠ μMm ≠ μmm。因此,用单因素方差分析法检验3种标记基因型间的性状均值差异是否显著,就能推知该标记是否与QTL连锁。标记与QTL间连锁越紧密,则标记基因型间均值的差异就越大,方差分析中F测验得到的F值也越大(即显著性越高)。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论