1、群体遗传 学,Population Genetics,井冈山大学医学院生物学与医学遗传学教研室,群体(population)是由一群可以相互交配的个体组成,因而仅仅从个体的遗传结构难以解释群体的遗传组成及其随时间和空间的变化规律。,不同人种,我国不同民族人群,群体遗传学(population genetics)主要研究群体中基因的分布及逐代传递中影响基因频率和基因型频率的因素,通过数学手段研究基因频率和相对应的表型在群体中的分布特征和变化规律,也是人类遗传学、人类进化和后基因组学研究的中心任务。,第一节 群体的遗传平衡,一、Hardy-Weinberg平衡律 在随机婚配的大群体中,没有受到外在
2、因素影响的情况下,显性性状并没有随着隐性性状的减少而增加,不同基因型相互比例在一代代传递中保持稳定。,亲代的两个等位基因频率和子代基因型频率,Hardy-Weinberg平衡律,第二代基因型频率,Hardy-Weinberg平衡律,各种婚配的后代基因型分布,Hardy-Weinberg平衡律,表中结果显示:AA后代=p4+2pq+pq=p(p+2pq+q)=p(p+q)=p;Aa后代=2pq+4pq+2pq=2pq(p+2pq+q)=2pq(p+q)=2pq;Aa后代=pq+2pq+ q4=q(p+2pq+q)=q(p+q)=q 可以看出在这一群体中第一代和第二代的基因型频率是一致的。实际上无
3、论经过多少代,基因型频率将保持不变,每种基因型的个体数量随着群体大小而增减,但是相对频率不变,这就是Hardy-Weinberg平衡的推理。,Hardy-Weinberg平衡律,二、Hardy-Weinberg平衡律的应用Hardy-Weinberg平衡判定例1:某一基因座的一对等位基因A和a,有三种基因型AA,AaaA和aa,在随机1000人的群体中,观察的基因型分布如下: AA为600人 AaaA为340人 aa为60人。,不同基因型频率的预期值和观察值,X2=1.607 p0.05,X2检验:当p0.05时,表示预期值和观察值之间的差异无统计学意义,等位基因频率和基因型频率分布符合Har
4、dy-Weinberg平衡,p0.05时,表示预期值和观察值之间的差异有统计学意义,等位基因频率和基因型频率分布不符合Hardy-Weinberg平衡。,例2:假设某一基因座的一对等位基因B和b,在1000 人群体中,该基因型频率分布是 BB为600人 Bb/bB为320人 bb为80人,经X2检验p0.05,该基因座随着BB纯合子的减少,Bb杂合子增加,该群体偏离了Hardy-Weinberg平衡。,二、Hardy-Weinberg平衡律的应用等位基因频率和杂合子频率例如:常染色体隐性遗传病囊性纤维化在欧洲白种人的发病率约1/2000,患者为突变基因的纯合子q21/2000,则q=1/200
5、0 =1/45=0.022, p=1-1/45=44/45=0.978,杂合子即携带突变基因的个体2pq=244/451/45=1/23=0.043。,第二节 影响遗传平衡的因素,一、非随机婚配 随机婚配指无须考虑配偶的基因型选择配偶;而非随机婚配可以通过两种方式增加纯合子的频率。,选型婚配(assortative mating),即选择具有某些特征(如身高、智力、种族)的配偶;如果这种选择发生在常染色体隐性遗传性聋哑病患者中,就将增加纯合患者的相对频率;近亲婚配(consanguineous mating),即有共同祖先血缘关系的亲属婚配,尽管表面上不改变等位基因频率,但可以增加纯合子的比例
6、,降低杂合子数量,因此使不利的隐性表型面临选择,从而又最终改变了后代的等位基因频率。,近亲婚配不仅提高了后代的有害隐性基因纯合子的发生风险,而且增加了后代对多基因或多因素疾病的出生缺陷的易感性,这是因为多基因病的患病风险与亲属级别成正比。 亲缘系数(coefficient of relationship,r)是指两个人从共同祖先获得某基因座的同一等位基因的概率。,不同亲属级别的亲缘系数,近婚系数:近亲婚配使子女中得到这样一对相同基因的概率,称为近婚系数(inbreeding coefficient,F),近婚系数估算(以常染色体上的某一基因座为例),同胞兄妹婚配中等位基因的传递,同胞兄妹的父亲
7、某一基因座有等位基因A1和A2,母亲的这个基因座有等位基因A3和A4。他们的子女中,A1A3,A1A4,A2A3,A2A4 各1/4 。这一对子女如果近亲婚配,所生后代中,形成A1A1、A2A2、A3A3、A4A4的总概率即为其近婚系数。,S形成纯合子A1A1、A2A2、A3A3、A4A4的总概率:4(1/2)4=1/4。一级亲属间的近婚系数就是F=1/4。,舅甥女(或姑侄)之间婚配S成为纯合子A1A1、A2A2、A3A3、A4A4的总概率为4(1/2)5=1/8,近婚系数F=1/8。,舅甥女婚配中等位基因的传递,如果是表兄妹婚配,形成A1A1、A2A2、A3A3、A4A4各需传递6步,所以其
8、近婚系数为4(1/2)6=1/16(右图)。三级亲属的近婚系数F=1/16。,表兄妹婚配中等位基因的传递,在二级表兄妹婚配的情况下,P1的等位基因A1经B1、C1、D1传递给S需经过4步传递,S为A1A1、A2A2、A3A3、A4A4各需8步传递,其近婚系数为4(1/2)8=1/64(右图),五级亲属的近婚系数F=1/64。,二级表兄妹婚配中等位基因的传递,评价近亲婚配对群体的危害时,除近亲婚配率以外,平均近婚系数(average inbreeding coefficient,a)有重要作用。a值可按下列公式计算:,其中,Mi为某型近亲婚配数,N为总婚配数,Fi为某型婚配的近婚系数。,不同国家
9、、地区人群中a值的比较,近亲婚配的危害增高隐性纯合子患者的频率例如:表兄妹婚配,所生子女(S)是隐性纯合子(aa)有两种原因:父母(C1和C2)近亲婚配从共同祖先(P1和P2)传递得到基因a,在这种情况下,如果群体中基因a的频率为q,S为aa的总概率是4(1/64)q=(1/16)q;由两个不同祖先分别传来基因a,在这种情况下,两个基因a可以来自同一曾祖(P1和P2)不同的同源染色体,可以来自不同曾祖(P1和P2),也可以来自祖辈( B1、B2、B3、B4)中的任何两个, S为aa的总概率为: ( 1-1/16)q2=(15/16)q2。,两者相加,(1/16)q,(15/16)q2,=,q2
10、+pq/16,表亲婚配和随机婚配生出隐性纯合子的概率,近亲婚配与非近亲婚配对后代影响的比较,二、选择 选择反映了环境因素对特定表型或基因型的作用,它可以是正性选择,也可以是负性选择。,Hardy-Weinberg平衡的理想化群体对基因型没有选择,但是,实际上对特定缺陷的表型往往由于生育力下降,有一个负性选择;遗传学上用生物适合度(biological fitness)来衡量生育力大小,反映下一代基因库的分布情况。,适合度f0时,表示遗传性致死,即无生育力;适合度f1,为生育力正常; 只有选择作用发生在育龄期之前,才会影响群体的基因频率或基因型频率,而发生在育龄期之后的选择作用,其影响将是微不足
11、道的。,例题:根据丹麦的一项调查,软骨发育不全的侏儒108人,共生育了27个子女,这些侏儒的457个正常同胞共生育了582个子女,侏儒的相对生育率(f)是:,相对生育率即代表适合度。选择系数(selection coefficient)指在选择作用下适合度降低的程度,用s表示。s反映了某一基因型在群体中不利于存在的程度,因此s=1-f。,三、突变 Hardy-Weinberg平衡是基于无突变的假设条件,如果某基因座具有较高的突变率,将使群体中的突变基因比例稳定增加。,基因突变率 基因突变率(frequency of gene mutation)指配子或单倍体细胞中某个基因出现突变的数量,通常以
12、100万个为单位来计算。,同一物种的不同亚群,或不同地区的同一基因的自发突变率往往有所不同。,在正常环境条件下,人类基因的突变率往往很低。测算每一世代每一位点的突变率有两种方法,即直接法和间接法。,(一)直接法此法的依据是如果双亲没有的显性基因在子女中出现,就认为这是由于新产生的突变。,群体中患者人数由于遗传而患病的患者人数 突变率()1/2 调 查 总 人 数,软骨发育不全、侏儒是一种显性遗传病,完全外显。根据丹麦Copenhagen的一个普查资料,在总共94075次分娩中,有10个儿童是软骨发育不全、侏儒,但其中有2个患儿的双亲之一也是该病的患者,故除去不计。其余8个患儿的父母均属正常,可
13、以认为是新突变的结果。正常双亲生出的94073个儿童代表188146个配子,其中有8个配子的基因发生了突变,所以可直接求得:,8软骨发育不全基因的突变率4.25210-5 188146,要求满足这一方法的条件很多:必须是常染色体显性遗传的疾病;外显率为100;无拟表型;无异质性;不能有早亡。因此此法仅限于少数几种疾病的研究。,(二)间接法 在间接计算时有一个假定条件,就是因病人生育力低而被淘汰的基因由新产生的突变基因来补偿,从而保持群体中基因频率的相对稳定。因为突变率是根据淘汰的基因数来估计的,所以是一种间接法。,现用间接法来测算软骨发育不全显性基因的突变率。患者的生育力较低,根据产院的记录,
14、108名患者共生育了27个儿童。为了判定这些侏需的相对生育力,以他们的457个正常同胞为对照,这些正常人共有582个儿童,如果正常人的生育力为1,则侏儒的相对生育力f为:,患者平均生育子女数 27/108f 0.20正常同胞平均生育子女数 582/457,这就是说,患者的生育力只有正常人的1/5,比正常人低4/5。这里的f称为适合度(fitness),它表示基因与环境之间的关系。选择系数指在选择作用下适合度降低的程度,S=1-f。,群体中侏儒的发病率最好用10/94075来估计。就这个基因而言,94075人共有940752个基因,而10个患儿有102个基因,其中一半是致病基因,所以,因病人的生
15、育力降低而丧失的基因则由新产生的突变基因来补偿。,显性基因的突变率()可用下式推算得到为:,10 sp(1 f)p(=11/5 ) 4.251910-5 294075,这个突变率数值与用直接法求得的数值4.25210-5是一致的,根据同样的道理,也可用间接法来推算隐性基因的突变率。但应理解,每一隐性个体的淘汰,丢失的等位基因不是一个,而是两个,所以在知道了患者的生育力和发病率以后,也可计算其突变率,唯一不同的地方就是不要除以2。,例如,囊性纤维变性是一种常染色体隐性遗传病,症状是粘液蓄积而使胰腺细胞萎缩,患者往往在幼年期死亡,所以生育力等于零。已知本病的发病率大约为百万分之四。所以:囊性纤维变
16、性的基因突变率()为:,sq2(1 f) q2=(10) (4/ 1000000)410-6,这就是说,隐性纯合子致病时,发病率就是突变率。如果生育率大于零,基因突变率自然就低于发病率。,间接法也可用于估计X连锁基因的突变率。 例如,血友病A是X连锁隐性遗传病,患者几乎都是男性。据调查,该病的发病q为0.00008。患者的凝血机制障碍,生活力较低,生育力仅及正常人的1/4,所以男性拥有的1/3X连锁基因,有3/4将因生育力降低而被淘汰,淘汰的基因由新产生的突变基因来补偿,这样可以求得X连锁隐性基因的基因突变率():,(1/3)sq(1/3)(1 f) q=(1/3)(10.25) (8/100
17、000)210-5,对于孟德尔遗传病的基因突变率可以进行估计: 常染色体显性遗传病 =I(1-f)/2 常染色体隐性遗传病 =I(1-f) X连锁隐性遗传病 = IM(1-f)3,人类中某些致病基因突变率的估计,四、遗传漂变 在大群体中,正常适合度条件下,繁衍后代数量趋于平衡,因此基因频率保持稳定;但是在小群体中可能出现后代的某基因比例较高的可能性,一代代传递中基因频率明显改变,破坏了Hardy-Weinberg平衡,这种现象称为随机遗传漂变(genetic shift)。,五、基因流 随着群体迁移两个群体混合并相互婚配,新的等位基因进入另一群体,将导致基因频率改变,这种等位基因跨越种族或地界
18、的渐近混合称之为基因流(gene flow)。,第三节 遗传负荷,遗传负荷是由群体中导致适合度下降的所有有害基因构成,主要有突变负荷和分离负荷,受近亲婚配和环境因素的影响。一个群体中遗传负荷的大小,一般以每个人携带有害基因的平均数量来表示。据估计每个人平均携带6个致死或半致死隐性突变基因。,一、突变负荷 (mutation load)是遗传负荷的主要部分,是由于基因的有害或致死突变而降低了适合度,给群体带来的负荷。突变负荷的大小取决于突变率( )和突变基因的选择系数(s)。,二、分离负荷 (segregation load)是由于杂合子(Aa)和杂合子(Aa)之间的婚配,后代中有1/4为纯合子
19、(aa),其适合度降低,因而导致群体适合度的降低,造成遗传负荷增加;如果纯合子(aa)的选择系数愈大,适合度降低愈明显,群体遗传负荷的增加愈显著。,三、影响遗传负荷的因素: 近亲婚配对遗传负荷的影响 环境对遗传负荷的影响,第四节 群体中的平衡多态现象,一、DNA多态性人类基因组具有广泛的多态性DNA多态性通常分为: 限制性片段长度多态性(RFLP)第代遗传标记; 数目可变的串联重复(VNTR)第代遗传标记; 单核苷酸多态性(SNP)第代遗传标记。,国际人类基因组单体型图计划(HapMap计划):该项目选取了来自欧、亚和非洲共270个正常个体,HapMap计划分为三个步骤:(1)在多个个体的DN
20、A样品中鉴定SNPs;(2)频率大于1%的相邻SNPs进行连锁不平衡分析,明确单体型(haplotype)组成;(3)在单体型中寻找用于识别这些单体型的标签SNPs(tagSNP)。,HapMap提供的高密度SNP信息为全基因组关联研究(genome wide association study,GWAS)提供可能。GWAS是指在全基因组层面开展多中心、大样本、反复验证的基因与疾病的关联研究。,二、染色体多态性染色体多态性是指正常人群中经常可见到的各种染色体形态的微小变异,故又称异形性(heteromorphism)。这种变异主要表现为同源染色体大小、形态或显带等方面的改变。染色体多态性遵循孟德尔遗传,可用于基因定位。,染色体多态性,1号染色体 多态性,1号和9号染色体异染色质区多态性,近端着丝粒染色体多态性,本章节重点,基因频率和基因型频率及计算遗传平衡定律影响群体遗传平衡的因素 突变、选择近亲婚配,