1、第十四章 群体与进化遗传分析第十四章 群体与进化遗传分析教学目的和要求:掌握生物进化的遗传基础,群体遗传平衡及其影响因素,新基因的来源和物种形成机制。教学重点和难点:群体遗传平衡及其影响因素。教学内容:第一节 群体的遗传结构一孟德尔群体和基因库二群体的基因频率与基因型频率第二节 Hardy-Weinberg 定律一Hardy-Weinberg 定律的内容二平衡群体的基本特征及其应用三 2检验抽样群体中基因型频率的平衡四复等位基因的遗传平衡五伴性基因的遗传平衡第二节 影响群体遗传平衡的因素一基因突变与选择二迁移三遗传漂变四非随机交配第三节 生物进化和新基因的起源途径一分子进化现象二生物进化理论三
2、新基因起源的途径第四节 物种形成的机制一物种二物种形成的生殖隔离机制三物种形成的遗传机制四人工促进生物进化的途径第十四章 群体与进化遗传分析第一节 群体的遗传结构一孟德尔群体和基因库1. 孟德尔群体(population):特定的地区内一群能相互交配繁殖后代的个体所组成的群体称为一个孟德尔群体,简称群体。群体可能是一个品系、一个品种、一个变种、一个亚种、甚至一个物种所有个体的总和。2. 基因库(gene pool):一个孟德尔群体所包含的基因总数称为一个基因库。3. 随机交配(random mating) :是指在一个有性繁殖的生物群中,一种性别的任何一个个体与其相反性别的个体交配的机会均等(
3、或概率相同),即任何一对雌雄个体的结合是随机的,不受任何其它因素的影响。二群体的基因频率与基因型频率1. 群体遗传结构:指孟德尔群体中的基因及基因型的种类和频率。2. 基因频率(gene frequency) :又叫等位基因频率(alleles frequency),是指一个群体内特定基因座上某一等位基因占该座位全部等位基因总数的比率,即该等位基因在群体内出现的概率。3. 基因频率是决定一个群体性质的基本因素,当环境条件和遗传结构不变时,一个群体某一基因座的基因频率是相对恒定的。不同群体中同一基因座的基因频率往往不同。如,有的牛群大多数有角,而有的牛群几乎全无角。4. 基因频率的表示方法:有小
4、数或百分数两种。同一座位各等位基因频率之和为1或100%。基因频率的变化范围在01之间,无负值。5. 基因型频率(genotype frequency):指群体中某相对性状的某一基因型占该相对性状所有基因型的比率,或某一相对性状的某一基因型在群体中出现的概率。 基因频率和基因型频率估算如:现有497个个体的群体,其基因型 分别为: BB = 452,Bb = 43和 bb = 2。它们的基因型频率分别是:D = f(BB) = 452/497 = 0.909,H = f(Bb) = 43/497 = 0.087,R = f(bb) = 2/497 = 0.004 合计:D+H+R=1.000基
5、因频率 p=f (B)=(2BBBb)/(2个体总数) = (2452+43)/(2497)=947/994=0.953q=f (b)=(2243)/(2497) = 47/994= 0.047合计:p+q =1.000或者用基因型频率推算基因频率p = f (B) = (BB的频率+1/2 Bb的频率) =0.909+0.0870.5=0.909+0.0435 =0.953q = f(b)=(bb的频率+1/2 Bb的频率)= 0.004+0.0870.5= 0.004+0.0435 = 0.047复等位基因的基因频率第十四章 群体与进化遗传分析牛奶草甲虫葡萄糖磷酸变位酶(PGM)座位上有3
6、个等位基因,每个等位基因编码了酶的不同分子变异体,在一个群体中基因型的数目如下:AA=4,AB=41,BB=84,AC=25,BC=88,CC=32,共计274个甲虫。它们的等位基因频率是:f (A) = p = (24+41+25)/2274 = 0.135f (B) = q = (284+41+88)/2274 = 0.542f (C) = r = (232+88+25)/2274 = 0.323 合计:p+q+r=1.000 基因频率和基因型频率间的关系(以一对等位基因为例)设某一基因座上有一对等位基因: A 和 a这对等位基因的频率分别为: p q由这对等位基因构成的基因型有: AA
7、Aa aa各基因型的个体数为: D H R由这三种基因型构成的群体总数为:N= ( D+ H+ R)则各基因型频率分别为: D=D/N,H=H/N,R=R/NN个个体所包含的基因总数为: 2N对伴性基因而言,可分成雌、雄两个群体来考查。对雄异型生物来说,雌性群体中基因频率与基因型频率的关系与常染色体上基因一样;雄性群体中,基因频率就等于基因型频率。雌异型生物的情况则刚好相反。第二节 Hardy-Weinberg 定律一Hardy-Weinberg 定律的内容遗传平衡定律:英国数学家Hardy和德国医生Weinberg经过各自独立的研究,于1908年分别发表了“基因平衡定律”的论文,因此又称为H
8、ardy-Weinberg law.1.遗传平衡定律的要点在随机交配的大群体中,若无其它因素的影响,群体的基因频率代代相传,始终保持1.不变。. 在任何一个大群体内,无论其基因频率如何,只要经过一代随机交配,一对常染色体 2上的基因所构成的基因型频率就达到平衡状态,若无其它因素的影响,并且每代都随机交配,则这种平衡保持不变。. 在平衡状态下,基因频率与基因型频率之间的关系为:D=p2,H=2pq,R=q2。或者说 3满足D=p2、H=2pq、R=q2条件的群体就是平衡群体。 平衡群体需符合的条件理想群体2.前提:理想群体是无限大的有性繁殖群体;随机交配;无突变、迁移、遗传漂变等作用;无任何形式
9、的自然选择和人工选择。结论:基因频率和基因型频率逐代不变。第十四章 群体与进化遗传分析3.定律的证明 数学证明 生物学证明(以人类的MN血型为例:人群中血型可视为随机婚配)血 型: M MN N (红细胞中含抗原)基 因: LM LN基 因 型: LMLM LMLN LNLN 总计调查结果(O):342 500 187 1029基因型频率: D=0.3324 H=0.4859 R=0.1817基因频率: p=0.57535 q=0.42465基因型理论频率:D=p2=0.3310,H=2pq=0.4887,R=q2=0.1803理论人数(E): 340.6 520.9 185.5 10292=
10、(O-E)2/E=0.856 a突变对基因频率的作用 2以一对等位基因为例: A a零世代基因频率为: p q一世代中基因A频率减少: u(1-q) vqp=u(1-q) - qv 若 p=0 即:u(1-q)=vq则群体达到新的平衡状态,此时群体的基因频率为:p=v/(u+v),q=u/(u+v)只要突变率不再改变,也无其它因素的影响,此基因频率保持代代不变。结论:在没有其他因素干扰时,平衡群体的基因频率由正反突变频率的大小决定。给定一对等位基因的正反突变频率,就可以计算平衡状态时的基因频率。例:u=110-6, v=510-7 则 p=33%, q=67%;u=v=110-6则 p=q=5
11、0%由于大多数基因突变频率很低(10-410-7),因此突变对基因频率的改变要经过很多世代pn=p0(1-u)n,当uv时。2.选择(Selection)适合度和选择系数 1适合度(fitness):指某一基因型与其它基因型相比,能够成活和繁殖后代的相对能力,记为W。选择系数(selective coefficient):指在选择的作用下降低的适合度,记为S,S=1-W。选择的作用 2第十四章 群体与进化遗传分析群体基因频率变化的主要力量,是进化和育种的主要依据;破坏群体的基因平衡,定向地改变群体的基因频率;增加有利基因或有益基因的频率,从而改变物种类型。针对不同基因选择的效果 3对隐性纯合体
12、不利的选择对显性基因不利的选择对杂合体有利的选择在突变和选择作用下的遗传平衡数量性状选择类型3.在突变和选择作用下的遗传平衡根据前面的推导可知:由突变产生a基因的频率为: q=pu=(1-q)u由选择导致a基因频率减少的量为:q=q02(1-q0)若 q=q,群体达到新的平衡,则:q=(u/v)这时,平衡时的基因频率由选择系数和突变率决定,与原来的基因频率无关。自然选择工业黑化现象(图片)1880年黑蛾的比例已超过了90%,1959年黑色型为93.3%。 二迁移1.迁移(migration):指群体间个体的流动或基因的交流。如果迁入个体中基因频率与原群体不同,将改变群体基因频率。设一群体的基因
13、频率为 p0,q0 ,若从另一群体(基因频率为pm,qm )迁入若干个体,迁入个体所占比例(迁入率)为m,则迁入后新群体的基因频率为:即基因频率变化取决于迁移率和两群体基因频率之差2. 迁移的遗传学效应(1)它将新的等位基因导入到群体中。(2)当迁移群体的基因频率和受纳群体的不同时,基因流改变了受纳群体的等位基因频率。三遗传漂变1.遗传漂变(又称遗传漂移,简称漂变) (genetic drift) :指因抽样误差造成基因频率的随机波动。群体遗传平衡的前提条件是随机交配的大群体。随机抽取的小群体相当于大群体的一个样本,样本容量越小,样本与总体间存在的偏差就越大,从而造成样本(小群体)与总体(大群
14、体)基因频率的差异。漂变发生在基因频率为01的群体中,群体越小,漂变的可能性就越大。2.实例设现有一种猪群(母群体),其疝症基因(隐性有害基因)a的频率为q=0.01,则p=0.99。现从该群体中引种两个种猪,有下列三种可能:三种基因型频率:D=0.9801,H=0.0198,R=0.0001,抽样概率如下:第十四章 群体与进化遗传分析引种个体基因型 概 率 由引种个体组成的子群体基因频率AA(p2) AA(p2) 0.9606 q=0 p=1Aa AA 0.0388 q=0.25 p=0.75Aa Aa 0.0004 q=0.50 p=0.503.此例说明:1)来自同一母群体的子群体,其基因
15、频率与母群体不同。甚至发生较大变化。母群体原来频率小的基因可能有大幅度增加。2)多次随机抽样组成的子群体之间,其基因频率不同。3)频率低的基因很易在群体中消失,向高的方向漂变的可能性较小;相反频率高的基因向高的方向漂变的可能性很大,消失的可能性很小。4)群体越小,漂变的作用就越大。5)漂变发生在基因频率大于0而小于1的群体中。4.漂变的特点遗传漂变没有确定的方向, 群体或世代间基因频率变化是随机的,因此又称为随机遗传漂变(random genetic drift)。遗传漂变可以解释中性突变(无适应能力差异的突变)频率在不同世代群体间的变化。例如:人类不同种族所具有的血型频率差异在实际中并没有适
16、应上的意义,可能同类人猿一样将血型差异一直传下来,可能是遗传漂变的结果。 5.奠基者效应(founder effect)一个新群体由有限几个原始祖先建立起来,发生极端的漂变现象,也称为建立者效应。实例:德国浸礼会的教派叫做Dunkers, 在1719年到1729年之间,有50个Dunker家庭从德国迁到美国定居,从此Dunkers保持了一个隔离的小群体,不能和教派之外的人群通婚,而他们本身的人数又是相当少。该人群与德国人及美国人的某些基因位点存在明显的差异,可见遗传漂变的作用。(见下表)四非随机交配1. 选型交配(assortative mating) 正选型交配(positive assor
17、tative mating):指表型或基因型相似的个体间交配的机会多于它们间随机交配的机会,又称为选同交配。 负选型交配(negative assortative mating):指不同表型或基因型的个体间交配的机会多于它们间随机交配的机会,又称为选异交配。杂交就是一种负选型交配。2. 近亲交配(inbreeding):简称近交,指有亲缘关系的个体相互交配而繁殖后代。3. 非随机交配只改变群体的基因型频率,而不影响基因频率。第三节 生物进化和新基因的起源途径一分子进化现象1生命的起源 地球生命的起源:是一个长达数十亿年的历史,经历了以下历程 有机物质与非细胞生命形式形成;第十四章 群体与进化遗
18、传分析 非细胞生物细胞生物; 原核细胞真核细胞;单细胞生物多细胞生物; 水生生物陆生生物; 高等生物的形成与动植物分化。 生命现象最基本的特征:生长、生殖、新陈代谢、适应性。2生物进化与环境生命形成与生物进化过程同时也是地球环境发展变化的进程,是生物与环境相互影响、相互作用的过程。 一方面环境中水源、光照、空气等条件变化决定生物发展的方向; 另一方面生物的存在和活动也对地球环境如大气层的形成等有不可忽视的影响。3.生物进化论的产生与发展基督教神学思想与物种神创论早期进化思想拉马克的进化论达尔文的进化论新拉马克主义与 新达尔文主义4.生物进化研究的现代发展如今生物进化机制与历程研究的发展即使不再
19、象它创立时那么突出、辉煌,但是科学研究者从没有停止探索,也没有停止发展。探索结果的发展形成了生物进化的新理论,主要包括: 群体遗传水平的“进化综合理论” ; 分子遗传水平的“中性学说” 。5. 分子水平的进化从分子水平研究生物进化的优点 1 传统的生物进化研究的主要依据是生物个体、细胞水平研究所提供的信息。 分子水平研究发现,在生物大分子中蕴藏了丰富的生物进化遗传信息;从分子水平研究生物进化具有以下优点: 根据生物所具有的核酸和蛋白质结构上的差异程度,可以估测生物种类的进化时期和速度。 对于结构简单的微生物的进化,只能采用这种方法。 它可以比较亲缘关系极远类型之间的进化信息。分子水平的进化信息
20、研究 2(1). 在不同物种中,相应核酸和蛋白质序列组成存在广泛差异,并且这些差异在长期生物进化过程中产生,具有相对稳定的遗传特性。(2). 根据这类信息可以估测物种间的亲缘关系:物种间的核苷酸或氨基酸序列相似程度越高,其亲缘关系越近,反之亲缘关系越远。(3). 从分子水平研究获得的生物进化信息与地质研究估计数据十分接近。A).氨基酸序列与系统发育 分析比较不同物种同功蛋白的组成,可以估测它们之间的亲缘程度和进化速度。 蛋白质进化中研究得最多的是血红蛋白和细胞色素c的氨基酸序列差异根据氨基酸序列差异估算物种进化的分歧时间第十四章 群体与进化遗传分析B).核苷酸序列与系统发育 同功蛋白基因、非蛋
21、白表达基因序列两两比较或多重比较,可以推断序列间同源性,并进行差异性分析构建分子水平系统进化树(evolution tree); 在结构基因组研究的基础上进行序列比较研究可能为物种比较提供更为全面的信息,甚至全基因组序列比较。 利用序列信息还可以估算分子进化速率,从而用分子进化钟来估算物种进化的分歧时间。C). 基因组的进化在自由生活的生物中,细胞内基因组 DNA 的含量与进化过程存在密切关系,不同生物按细胞内 DNA 含量不同,可分为四大重叠类群: 细菌DNA 含量最低,变动于 0.0030.01pg; 真菌每个细胞 DNA 含量不足 0.1pg; 大多数动物和某些植物 每个细胞 DNA 含
22、量变动于 0.110pg; 蝾螈、某些鱼和许多植物每个细胞 DNA 含量大于 10pg。 一般情况下,高等生物遗传信息比低等生物复杂,因此基因组内 DNA 含量较高;而低等生物的基因组 DNA 含量相对较低。 基因组 DNA 含量与生物的进化也有矛盾之处,尤其在真核生物中。因为真核生物基因组DNA 中存在大量高度重复且无功能的区段自私 DNA,导致了 DNA 含量与其进化水平的矛盾。6 中性学说中性基因分子水平研究发现生物基因组中存在中性基因突变:不同等位基因间碱基序列存在差异,但无表型选择作用。中性基因频率改变不是选择压引起,而主要是由遗传漂变引起。基因中性突变可能有以下几种情况: 氨基酸序
23、列改变性状变异,但无选择意义(中性性状); 氨基酸序列改变,但蛋白质功能不发生改变(中性突变); 氨基酸序列不改变(同义突变)。1968 年木村资生提出了分子进化的“中性学说” ,全称是“中性突变漂移假说” 。他认为:中性基因在种内的积累不是由于自然选择,而是由于遗传漂变导致的偶然固定;决定分子进化的主导因素是那些对生物生存既无利、又无害的“中性”基因;生物物种间(中性基因)在分子水平上的进化速率是一致的。自然选择学说在分子水平的矛盾(1). 自然选择学说认为:生物进化是微小变异长期选择而产生的群体遗传定向改变的过程。(2). 据此可以推测:具有适应性意义的基因,在定向选择作用下进化速率应该比中性基因快;存在于物种间分子水平上的差异也更大。(3). 但现有分子水平的研究表明:中性基因往往比那些功能上重要的基因在物种间差异要大得多。也就是说:中性基因的进化速率比具有重要功能的基因快。二生物进化理论