1、Zhejiang Provincial Key Lab of Medical Genetics,基因、基因组与基因组学Gene、Genome & Genomics,温州医学院检验医学院,医学分子生物学 第二章,Zhejiang Provincial Key Lab of Medical Genetics,2.1 基因的结构与功能 2.2 基因组的结构与功能 2.3 基因组学,主要内容,Zhejiang Provincial Key Lab of Medical Genetics,2.1.1 基因的分类2.1.2 基因的结构2.1.3 基因的功能,2.1 基因的结构与功能,Zhejiang Pr
2、ovincial Key Lab of Medical Genetics,基因的概念,遗传学角度:分子生物学角度:,基因(gene):是指携带有遗传信息的DNA或RNA序列,也称为遗传因子。,基因(gene):是合成有功能的蛋白质或RNA所必需的全部DNA,包括编码蛋白质或RNA的核酸序列及为保证转录所必需的调控序列。,Zhejiang Provincial Key Lab of Medical Genetics,基因的研究简史,孟德尔(Mendel)的颗粒因子:一个因子决定一个性状(1865年)。约翰森(Johannsen):首先提出基因一词(1909年)摩尔根(Morgan)的基因论:一个
3、基因控制一个性状(1926年),明确了基因存在于染色体上。Beadle 和Tatum:一个基因一个酶学说(1941年)。Avery肺炎双球菌转化实验:证实了遗传物质的本质是DNA(1944年)。,Zhejiang Provincial Key Lab of Medical Genetics,赫尔希和蔡斯:噬菌体大肠杆菌感染实验,只有DNA能进入大肠杆菌(1952年)。Watson 和Crick:提出DNA右手双螺旋理论(1953年)。Crick:提出中心法则(1957年)。Benzer:提出一个顺反子,一条多肽链的概念(1957年)。Jacob和Monod:提出了操纵子模型(1961年)。尼伦
4、伯格:三联密码子学说将DNA结构与生物功能结合起来(1966年) 。Sharp等:真核生物基因中的断裂现象(1977年)。 噬菌体中发现了重叠基因(1978年)。,Zhejiang Provincial Key Lab of Medical Genetics,2.1.1 基因的分类,基因根据其是否具有转录和翻译功能可分为:结构基因(structural genes):可被转录形成mRNA,并转译成多肽链,构成各种结构蛋白质,催化各种生化反应的酶和激素等。调节基因(regulatory genes):指某些可调节控制结构基因表达的基因。核糖体RNA基因(ribosomal RNA genes,r
5、RNA基因)与转运RNA基因(transfer RNA genes, tRNA基因) :这类基因只转录产生相应的RNA而不翻译成多肽链。,Zhejiang Provincial Key Lab of Medical Genetics,2.1.2 基因的结构,人类基因按照功能的不同分为3个区域:编码区:能够编码产生蛋白质的序列,包括外显子与内含子前导区:位于编码区上游,相当于mRNA 5端非编码区(非翻译区)调节区:包括启动子和增强子等基因编码区的两侧也称为侧翼序列,Zhejiang Provincial Key Lab of Medical Genetics,基因的一般结构,Zhejiang
6、Provincial Key Lab of Medical Genetics,2.1.2 基因的结构,病毒到高等生物的细胞核均共用一套遗传密码。牛,酵母线粒体和植物叶绿体基因序列结构的研究发现,其密码有异于细胞核的遗传密码 。密码子有可能重复利用。基因的大小主要取决于其内含子的有无、大小以及数量。,开放阅读框架( open reading frame,ORF ):是指DNA链上,由蛋白质合成的起始密码开始,到终止密码为止的一个连续编码。,Zhejiang Provincial Key Lab of Medical Genetics,2.1.3 基因的功能,基因有控制遗传性状和活性调节的功能。基
7、因的表达活性有严格的时间和空间特异性。基因主要通过两条途径控制生物的性状:一是通过控制酶的合成来控制生物的性状。二是通过控制结构蛋白的成分直接控制生物的形状。,Zhejiang Provincial Key Lab of Medical Genetics,2.2 基因组的结构与功能,2.2.1 病毒基因组的结构和功能 2.2.2原核生物基因组的结构和功能 2.2.3真核生物基因组的结构和功能,Zhejiang Provincial Key Lab of Medical Genetics,基因组(genome):是指生物体全套遗传信息,包括所有基因和基因间的区域,原核生物(prokaryote)
8、和真核生物(eukaryote)的基因组都是DNA 病毒基因组有的是DNA,有的是RNA,基因组(原核生物和真核生物),2.2 基因组的结构与功能,染色体基因组(chromosomal genome) 染色体外基因组(extrachromosomal genome) 如:细菌的质粒(plasmid)DNA 真核生物的线粒体(mitochondria)DNA 叶绿体(chloroplast)DNA,Zhejiang Provincial Key Lab of Medical Genetics,基因组的大小通常以其DNA的含量来表示。进化程度越高的生物其基因组越大DNA含量越高,结构也越复杂。存在
9、反常现象: 许多复杂性相近的生物体其基因组大小却显著不同:果蝇的基因组大约是蝗虫基因组的1/25。,C值(C value):是指一种生物体单倍体基因组DNA的总量。,Zhejiang Provincial Key Lab of Medical Genetics,表2-1 不同生物体基因组中基因的比较,待续,Zhejiang Provincial Key Lab of Medical Genetics,Zhejiang Provincial Key Lab of Medical Genetics,Zhejiang Provincial Key Lab of Medical Genetics,2.
10、2.1 病毒基因组的结构和功能,Zhejiang Provincial Key Lab of Medical Genetics,2.2.1.1病毒基因组可以由DNA或RNA组成,病毒的核酸通常是DNA或为RNA分子,目前未见报道在同一病毒颗粒中共存在两种核酸的情况。病毒基因组的DNA或RNA可以是单链的,也可以是双链的,可以是闭环的,也可以是线性的。,基因组 形状 乳头瘤病毒 DNA 双链闭环 腺病毒 DNA 双链线状 脊髓灰质炎病毒 RNA 单链 呼肠弧病毒 RNA 双链,Zhejiang Provincial Key Lab of Medical Genetics,2.2.1.2 病毒基因
11、组的大小相差较大,病毒的基因组很小:与细菌或真核细胞相比。不同的病毒之间其基因组大小相差很大。 乙肝病毒DNA:3kb,信息量较小,编码4种蛋白质 痘病毒的基因组:300kb,编码几百种蛋白质(病毒复制所涉及 的酶类编码,核苷酸代谢的酶类)病毒基因组的大小通常与其对宿主的依赖程度有关,基因组越大,依赖性越小。,Zhejiang Provincial Key Lab of Medical Genetics,2.2.1. 3 部分RNA病毒基因组编码序列具有节段性,多数RNA病毒的基因组是由连续的核糖核酸链组成,但也有些病毒的基因组RNA由不连续的几条核酸链组成: 流感病毒的基因组RNA分子是节段
12、性的,由八条RNA分子构成,每条RNA分子都含有编码蛋白质分子的信息 轮状病毒的基因组由10个节段性的线性双链RNA分子构成,每段RNA分子都编码一种蛋白质。 分段基因组的病毒一般感染效率较低 分段基因组容易发生重组,故病毒容易变异,Zhejiang Provincial Key Lab of Medical Genetics,2.2.1. 4 病毒基因存在基因重叠,这种现象在其它的生物细胞中仅见于线粒体和质粒DNA,是病毒基因组的结构特点。这种结构的意义在于使较小的基因组能够携带较多的遗传信息。 重叠基因是1977年Sanger在研究X174时发现的。,基因重叠:是指同一段DNA片段能够参与
13、编码两种甚至两种以上的蛋白质分子。,Zhejiang Provincial Key Lab of Medical Genetics,基因重叠,X174是一种单链DNA病毒,宿主为大肠杆菌。它感染大肠杆菌后可合成11个蛋白质分子,总分子量为25万左右,相当于6078个核苷酸所容纳的信息量。而X174病毒DNA本身却只有5375个核苷酸,最多只能编码总分子量为20万的蛋白质分子。,Zhejiang Provincial Key Lab of Medical Genetics,基因重叠的方式,(1)一个基因完全在另一个基因里面。(2)几个基因部分重叠。(3)两个基因之间只有一个碱基重叠。,Zheji
14、ang Provincial Key Lab of Medical Genetics,噬菌体X174的重叠基因,Zhejiang Provincial Key Lab of Medical Genetics,基因重叠的方式,(1)一个基因完全在另一个基因里面。(2)几个基因部分重叠。(3)两个基因之间只有一个碱基重叠。,Zhejiang Provincial Key Lab of Medical Genetics,2.2.1. 5 病毒基因组的大部分序列具有编码功能,病毒基因组的大部分是用来编码蛋白质的,只有非常小的一部份没有编码功能翻译,这与真核细胞基因组截然不同。X174基因组中不编码的序
15、列只占217/5375乳头瘤病毒基因组约8.0Kb,其中不编码的部分约为1.0kb。,Zhejiang Provincial Key Lab of Medical Genetics,2.2.1. 6 病毒基因组的转录单元是多顺反子,多顺反子mRNA(polycistronie mRNA) :是指病毒基因组DNA序列中功能上相关的蛋白质的基因或rRNA的基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。它们可被一起转录成含有多个mRNA的分子。,Zhejiang Provincial Key Lab of Medical Genetics,噬菌体X174,X174 基因组中
16、的D-E-J-F-G-H基因也转录在同一个mRNA中,然后再翻译成各种蛋白质,其中、F、G及H都是编码外壳蛋白的,D 蛋白与病毒的装配有关,E 蛋白负责细菌的裂解, 因此它们在功能上是相关的,Zhejiang Provincial Key Lab of Medical Genetics,2.2.1.7 病毒基因组都是单倍体, 反转录病毒例外,是二倍体,Zhejiang Provincial Key Lab of Medical Genetics,2.2.1.8 噬菌体基因具有连续性,而真核细胞病毒的基因是不连续的,Zhejiang Provincial Key Lab of Medical G
17、enetics,2.2.2原核生物基因组的结构和功能,原核生物基因组通常比较简单,其基因组大小在106bp107bp之间,所包含的基因数目几百个到数千个之间。,类核(nucleoid):是指原核生物基因组通常由一条环状的双链DNA分子组成,在细胞中与蛋白质结合成染色体的形式,在细胞内形成一个致密的区域。,Zhejiang Provincial Key Lab of Medical Genetics,图 大肠杆菌的类核结构模型,Zhejiang Provincial Key Lab of Medical Genetics,2.2.2.1 大肠杆菌染色体基因组的结构和功能,大肠杆菌基因组序列中的基
18、因密度非常高,编码区所占的比例较大。大肠杆菌中总共有4288个基因,平均编码长度为950bp,基因之间的间隔区长度为118bp,而且这些结构基因没有内含子。大肠杆菌DNA分子中的重复序列很少,但在大肠杆菌基因组中不同部位可以有称为转座子的50kb的重复片段。,Zhejiang Provincial Key Lab of Medical Genetics,大肠杆菌染色体基因组,Zhejiang Provincial Key Lab of Medical Genetics,转座因子,最初是在大肠杆菌半乳糖操纵子的研究中发现的。原核生物转座因子主要有二类:一类是插入序列(insertion sequ
19、ence,IS) :2 000bp以内,两端正向重复序列(direct repeats,DR)、反向重复序列(inverted repeats,IR),中间1kb左右的编码序列,仅编码和转座有关的转座酶。另一类是复合型转座子( composite transposon) :2 00020 000bp之间,两端由一对IS元件组成,带有与转座作用有关的基因和其他基因。,Zhejiang Provincial Key Lab of Medical Genetics,图 Tn的基本结构,Zhejiang Provincial Key Lab of Medical Genetics,2.2.2.2大肠杆
20、菌染色体外基因组的结构和功能,大肠杆菌质粒是双链环状结构的DNA分子。可以有共价闭合环状DNA、缺口的环状、DNA线性DNA 三种结构状态。,质粒(plasmid):是指一类染色体外具有自主复制能力的环状双链DNA分子,属染色体外基因组。,Zhejiang Provincial Key Lab of Medical Genetics,质粒 (plasmid),特点:能在宿主细胞内独立自主复制;带有某些遗传信息, 会赋予宿主细胞一些遗传性状。,Zhejiang Provincial Key Lab of Medical Genetics,质粒的功能,质粒对宿主细胞的生存一般不是必需的,但质粒带有
21、某些特殊的不同于宿主细胞的遗传信息,其存在赋予宿主细胞一些新的遗传性状,某些情况下有利于细胞的生长。,Zhejiang Provincial Key Lab of Medical Genetics,表2-2 细菌质粒所控制的一些性状。,Zhejiang Provincial Key Lab of Medical Genetics,质粒的复制,质粒能自主复制,是能独立复制的复制子(autonomous replicon)。严紧控制(stringent control)型质粒:其复制常与宿主的繁殖偶联,拷贝数较少,每个细胞中只有1个到十几个拷贝。松弛控制(relaxed control)型质粒:其
22、复制与宿主不偶联,每个细胞中有几十到几百个拷贝。,Zhejiang Provincial Key Lab of Medical Genetics,质粒的稳定性与不相容性,影响质粒稳定性的因素有两种:宿主细胞分裂时质粒能否均衡地分配到子代细胞。质粒分子自身结构的稳定性。,质粒的不相容性(incompatibility):是指两个不同的质粒因利用同一复制和维持机制,在复制和随后向子代细胞分配的过程中会发生竞争,从而不能在同一宿主细胞内稳定存在,其中一种质粒将被丢失的现象。,Zhejiang Provincial Key Lab of Medical Genetics,2.2.3 真核生物基因组的结
23、构和功能,真核生物的遗传物质绝大部分存在于细胞核染色体,少部分存在于线粒体或叶绿体中,因此真核生物基因组可分为细胞核基因组和细胞器基因组。,Zhejiang Provincial Key Lab of Medical Genetics,真核生物的染色体基因组一般比较庞大,例如人的单倍体基因组由3109bp碱基组成,按1000个碱基编码一种蛋白质计算,理论上可有300万个基因。但实际上,人类基因组中仅含有25 00030 000个基因。这些与表达无关的DNA大部分是基因间隔区序列,基因间隔区序列主要由重复DNA构成。 只有很少一部份(约占2-3)的DNA序列用以编码蛋白质和结构RNA。,Zhej
24、iang Provincial Key Lab of Medical Genetics,2.2.3.1 真核生物染色体基因组特点,2.2.3.1.1真核生物基因组存在大量的重复序列 2.2.3.1.2 真核基因组的另一特点是存在多基 因家族与假基因,Zhejiang Provincial Key Lab of Medical Genetics,2.2.3.1.1真核生物基因组存在大量的重复序列,单拷贝序列中度重复序列高度重复序列,Zhejiang Provincial Key Lab of Medical Genetics,2.2.3.1.1.1单拷贝序列(低度重复序列),在单倍体基因组中,单
25、拷贝序列只有一个或几个拷贝,占DNA总量的40-80: 果蝇中占79,小鼠中占70。结构基因基本上属于单拷贝序列,储存的巨大遗传信息,用来编码各种不同功能的蛋白质,体现了生物的各种功能。,Zhejiang Provincial Key Lab of Medical Genetics,2.2.3.1.1.2 中度重复序列,中度重复序列在真核基因组中重复次数为10105,占DNA总量的10-40: 果蝇中占15,小鼠中占20。编码rRNA、tRNA、组蛋白以及免疫球蛋白的机构基因等都属于这一类,另有部分可能与基因的调控有关。,Zhejiang Provincial Key Lab of Medic
26、al Genetics,Alu家族,是中度重复序列研究较多的一种散在重复序列,因序列内部有限制性内切酶AluI的酶切位点而得名。 Alu序列每个成员的长度约300bp,由两个130bp的正向重复序列组成,二者之间有31bp的间隔序列,Alu序列的重复次数为30-50万次。,Zhejiang Provincial Key Lab of Medical Genetics,rRNA基因,rRNA基因通常集中成簇存在,而不是分散于基因组中,这样的区域称为rDNA,如染色体的核仁组织区(nucleolus organizer region)即为rDNA区。,Zhejiang Provincial Key
27、 Lab of Medical Genetics,图 非洲爪蟾的rRNA基因结构,Zhejiang Provincial Key Lab of Medical Genetics,2.2.3.1.1.3高度重复序列,高度重复序列在真核基因组中重复次数可高达百万(106)以上,在基因组中所占比例随种属而异,约占DNA总量10-60,可以集中串联排列在某一区域。典型的高度重复序列DNA有反向重复序列(inverted repeats)和卫星DNA(satellite DNA)。,反向重复序列 :是指两个相同顺序的互补拷贝在同一DNA链上的反向排列。,卫星DNA 是另一类高度重复序列,这类重复序列的重
28、复单位一般由2-10bp组成,成串排列。,Zhejiang Provincial Key Lab of Medical Genetics,图 反向重复序列发夹式结构,Zhejiang Provincial Key Lab of Medical Genetics,卫星DNA(satellite DNA),重复顺序:由2-10bp组成重复单位,重复单位成串排列而成由于这类序列的碱基组成不同于其他部份,可用等密度梯度离心法将其与主体DNA 分开,因而称为卫星DNA (或随体DNA)在人细胞组中,卫星 DNA约占 5-6,Zhejiang Provincial Key Lab of Medical G
29、enetics,2.2.3.1.1.4 重复序列的多态性,DNA多态性是指DNA序列发生变异从而导致的个体间核苷酸序列的差异,主要包括: 单核苷酸多态性(single nucleotide polymorphism,SNP) SNP是由基因组DNA上的单个碱基的变异引起的DNA序列多态性。是人群中个体差异最具代表性的DNA多态性,相当一部分还直接或间接与个体的表型差异、对疾病的易感性或抵抗能力、对药物的反应性等相关。SNP被认为是一种能稳定遗传的早期突变 串联重复序列多态性(tandem repeats polymorphism),Zhejiang Provincial Key Lab of
30、Medical Genetics,短串联重复序列,由几个碱基对作为核心单位,串联重复形成的一类DNA序列,由于核心单位重复数目的变化,构成了STR基因座的遗传多态性。分布于人类整个基因组,平均每15kb就存在一个STR基因座。人类基因组已发现了七千个以上的STR位点。具有分布广泛,易于检测,信息量大,有高度多态性并遵循孟德尔共显性遗传等优点。目前STR分析已广泛应用于遗传制图、连锁性分析、亲子鉴定、疾病基因定位和物种多态性研究等领域 。,Zhejiang Provincial Key Lab of Medical Genetics,2.2.3.1.2 真核基因组的另一特点是存在多基因家族与假基
31、因,珠蛋白基因家族:家族的不同成员成簇地分布在不同染色体上,但核酸序列高度同源,编码一组功能上紧密相关的蛋白质。 组蛋白基因家族:基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质。,多基因家族(multi gene family) :是指由某一祖先基因经过重复和变异所产生的一组基因。,Zhejiang Provincial Key Lab of Medical Genetics,图 人珠蛋白多基因家族,Zhejiang Provincial Key Lab of Medical Genetics,假基因与有功能的基因同源,原来可能也是有功能的基因,但由于缺失,倒位或点突变
32、等,使这一基因失去活性,成为无功能基因。 传统假基因(conventional pseudogene) 加工的假基因(processed pseudogenes),假基因(pseudo gene):是指与某些有功能的基因结构相似,但不能表达有功能的基因产物的某些基因。,Zhejiang Provincial Key Lab of Medical Genetics,图 加工的假基因,Zhejiang Provincial Key Lab of Medical Genetics,2.2.3.2 真核生物细胞器基因组的结构与功能特点,真核生物有两类细胞器能携带遗传物质:线粒体和叶绿体。这些遗传物质独
33、立于细胞核基因组外,能够自行复制和表达,又称为染色体外基因组。大多数细胞器基因组是环状DNA,某些低等真核生物(如草履虫、衣滴虫和几种酵母)的线粒体DNA是线状分子。通常每个细胞内有许多细胞器,每个细胞器基因组又有许多拷贝。,Zhejiang Provincial Key Lab of Medical Genetics,线粒体基因组编码其自身蛋白质合成体系的某些成员,如rRNA和tRNA等,以及呼吸链中的某些成员,如ATP酶、NADH还原酶、细胞色素氧化酶复合体中的某些组分。线粒体蛋白质合成体系及呼吸链中的其它成员由细胞核基因组编码。,Zhejiang Provincial Key Lab o
34、f Medical Genetics,Zhejiang Provincial Key Lab of Medical Genetics,高等动物线粒体基因组具有独特的特点:,母系遗传。子代线粒体基因组来自母亲,父系的线粒体基因组在精卵结合时一般不能进入卵细胞。因此,在子代个体发育过程中没有父母双方线粒体DNA的重组发生。线粒体DNA损伤后不易修复,突变率较高,可能与衰老及某些疾病有关。遗传密码与通用遗传密码存在差别,如UGA(终止密码子)编码Trp,AGA/AGG(Arg)为终止密码子,AUA(Ile)为起始密码子并编码Met。,Zhejiang Provincial Key Lab of Me
35、dical Genetics,2.3 基因组学,基因组学(Genomics)是一门对生命有机体全基因组进行序列分析和功能研究的新兴学科。随着人类基因组测序工作的初步完成,基因组学的研究由最初的结构基因组学向功能基因组学转移。研究目标从单纯的基因结构和表达发展为整体水平上的基因组分析。,基因组学(genomics):以基因组为研究对象的一门科学,包括基因组作图、核苷酸序列测定、基因定位及基因功能分析等。,Zhejiang Provincial Key Lab of Medical Genetics,2.3 基因组学,2.3.1 人类基因组计划2.3.2 结构基因组学 2.3.3 基因定位克隆 2
36、.3.4 基因组功能研究 2.3.5 基因组学与进化 2.3.6 宏基因组学,Zhejiang Provincial Key Lab of Medical Genetics,2.3.1 人类基因组计划,人类基因组计划(The Human Genome Project, HGP)是二十世纪九十年代处开始启动的多国科学合作计划,对由少数人进行全基因组(即24条非同源染色体,共30亿碱基)的测序和拼接,绘制出人类基因的谱图 。我国于1999年9月积极参加到这项研究计划中的,承担其中1%的任务,即人类3号染色体上约3000万个碱基对的测序任务。,基因组计划( genome project):以获得某物
37、种基因组全序列为主要目标的科学计划,Zhejiang Provincial Key Lab of Medical Genetics,2.3.2 结构基因组学,主要包括全基因组测序和序列信息的结构分析。基因组研究的中心内容之一。,Zhejiang Provincial Key Lab of Medical Genetics,2.3.3 基因定位克隆,基因定位克隆:是指利用微卫星和SNP全基因组扫描来搜索与疾病性状紧密相关的位点,从而确定疾病相关基因的位置并进一步获得克隆。,随着基因组序列信息的积累,基因的定位克隆成果丰富,并且在多基因疾病的数量性状等基因的克隆方面也有很大进展。,Zhejiang
38、 Provincial Key Lab of Medical Genetics,2.3.4 基因组功能研究,根据已有基因的功能推测基因组中具有相似结构的基因的功能,借助这种同源性分析认识一个新基因的功能。基因突变失活有效的方法有定点突变、基因敲除(knock-out)和RNA干扰技术等。,Zhejiang Provincial Key Lab of Medical Genetics,2.3.5 基因组学与进化,生物进化的研究表明,所有生命都来自一个共同的祖先。基因组信息数学分析可获得的最重要的直接结果之一就是物种之间的进化距离 。比较基因组学:是一门新兴的交叉学科,在基因组学水平上研究不同物种在基因组结构与功能方面亲缘关系、内在的联系,以及进化地位。,Zhejiang Provincial Key Lab of Medical Genetics,2.3.6 宏基因组学(Metagenomics),宏基因组学就是以环境样品中的微生物群体基因组为研究对象, 以功能基因筛选和测序分析为研究手段,通过非培养方法进行某个特殊生态环境中微生物群落的鉴定。主要技术包括DNA的提取、文库的构建和目标基因克隆的筛选可用于发现新基因、开发新的生物活性物质、研究群落中微生物多样性等。,宏基因组 :是指生境中全部微小生物遗传物质的总和。,