1、 第一章 绪论分子生物学分子生物学的基本含义 (p8)分子生物学是研究核酸、蛋白质等所有生物大分子的形态、结构特征及其重要性、规律性和相互关系的科学,是人类从分子水平上真正揭开生物世界的奥秘,由被动地适应自然界转向主动地改造和重组自然界的基础学科。分子生物学与其它学科的关系分子生物学是由生物化学、生物物理学、遗传学、微生物学、细胞学、以至信息科学等多学科相互渗透、综合融会而产生并发展起来的,凝聚了不同学科专长的科学家的共同努力。它虽产生于上述各个学科,但已形成它独特的理论体系和研究手段,成为一个独立的学科。生物化学与分子生物学关系最为密切 :生物化学是从化学角度研究生命现象的科学,它着重研究生
2、物体内各种生物分子的结构、转变与新陈代谢。传统生物化学的中心内容是代谢,包括糖、脂类、氨基酸、核苷酸、以及能量代谢等与生理功能的联系。分子生物学则着重阐明生命的本质-主要研究生物大分子核酸与蛋白质的结构与功能、生命信息的传递和调控。细胞生物学与分子生物学关系也十分密切:传统的细胞生物学主要研究细胞和亚细胞器的形态、结构与功能。探讨组成细胞的分子结构比单纯观察大体结构能更加深入认识细胞的结构与功能,因此现代细胞生物学的发展越来越多地应用分子生物学的理论和方法。分子生物学则是从研究各个生物大分子的结构入手,但各个分子不能孤立发挥作用,生命绝非组成成分的随意加和或混合,分子生物学还需要进一步研究各生
3、物分子间的高层次组织和相互作用,尤其是细胞整体反应的分子机理,这在某种程度上是向细胞生物学的靠拢。第一章序论1859 年发表了物种起源 ,用事实证明“物竞天择,适者生存”的进化论思想。指出:物种的变异是由于大自然的环境和生物群体的生存竞争造成的,彻底否定了“创世说” 。达尔文第一个认识到生物世界的不连续性。意义:达尔文关于生物进化的学说及其唯物主义的物种起源理论,是生物科学史上最伟大的创举之一,具有不可磨灭的贡献。细胞学说 建立及其意义德国植物学家施莱登和动物学家施旺共同提出:一切植物、动物都是由细胞组成的,细胞是一切动植物的基本单位。经典遗传学两条基本规律:统一律:当两种不同植物杂交时,它们
4、的下一代可能与亲本之一完全相同;分离规律:将不同植物品种杂交后的 F1 代种子再进行杂交或自交时,下一代就会按照一定的比例分离,因而具有不同的形式。1865 年发表植物杂交试验 ,直到 1900 年才被人们重新发现。孟德尔被公认为经典遗传学的奠基人。现代遗传学Morgan 及其助手第一次将代表某一特性的基因同染色体联系起来,使科学界普遍认识了染色体的重要性并接受了孟德尔的遗传学原理。Morgan 特别指出:种质必须由某些独立的要素组成,我们把这些要素称为遗传因子或基因。第二节 分子生物学发展简史准备和酝酿阶段(19 世纪后期到 20 世纪 50 年代初)对生命本质的认识上的两点重大突破:1确定
5、了蛋白质是生命的主要基础物质2确定了生物遗传的物质基础是 DNA现代分子生物学的建立和发展阶段(20 世纪 50 年代初到70 年代初):这一阶段以 1953 年 Watson 和 Crick 提出的DNA 双螺旋结构模型作为现代分子生物学诞生的里程碑开创了分子遗传学基本理论建立和发展的黄金时代。在此期间的主要进展包括:遗传信息传递中心法则的建立对蛋白质结构与功能的进一步认识DNA 双螺旋发现的意义:确立了核酸作为信息分子的结构基础;提出了碱基配对是核酸复制、遗传信息传递的基本方式;从而最后确定了核酸是遗传的物质基础,为认识核酸与蛋白质的关系及其在生命中的作用打下了最重要的基础。Crick 于
6、 1954 年所提出的中心法则(Central Dogma ):初步认识生命本质并开始改造生命的深入发展阶段(20世纪 70 年代后至今)基因工程技术的出现作为标志。其间的重大成就包括:重组 DNA 技术的建立和发展基因组研究的发展单克隆抗体及基因工程抗体的建立和发展基因表达调控机理细胞信号转导机理研究成为新的前沿领域第三节 分子生物学的主要研究内容一DNA 重组技术(recombinant DNA technology)定义:又称为基因工程,根据分子生物学和遗传学的原理,将一种生物的遗传物质 DNA 转移到另一生物体中,使后者获得新的遗传性状或表达出所需要的产物。DNA 重组技术的应用:利用
7、微生物基因工程生产重组基因工程药物、转基因植物和动物体细胞克隆、基因表达与调控的基础研究。二生物大分子的结构功能研究三基因组、功能基因组与生物信息学的研究基因组、蛋白质组与生物信息学基因组(Genome) :细胞或生物体一条完整单体的全部染色体遗传物质的总和。人类基因组计划(Human Genome Project, HGP): 测定出人基因组全部 DNA3109 硷基对的序列、确定人类约 5-10 万个基因的一级结构 。基因组、蛋白质组与生物信息学蛋白组计划(Proteome project):又称为后基因组计划或功能基因组计划,用于揭示并阐明细胞、组织乃至整个生物个体全部蛋白质及其功能。生
8、物信息学(Bioinformatics ) :是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。四基因表达调控研究第二章 染色体与 DNA 本章内容1. 染色体2. DNA 的结构3. DNA 的复制4. 原核生物和真核生物 DNA 复制特点5. DNA 的修复6. DNA 的转座第一节 染色体(chromosome)概念:染色体(chromosome):原指真核生物细胞分裂中期具有一定形态特征的染色质。现在这一概念已扩大为包括原核生物及细胞器在内的基因载体的总称。染色质(chromatin):由 DNA 和蛋白质构成,在分裂间期染色体结构疏松,称为染色质。其实染色质与
9、染色体只是同一物质在不同细胞周期的表现。常染色质(euchromatin):是进行活跃转录的部位,呈疏松的环状,电镜下表现为浅染,易被核酸酶在一些敏感的位点(hypersensitive sites) 降解。异染色质(heterochromatin):在间期核中处于凝缩状态,无转录活性,也叫非活动染色质(inactive chromatin),是遗传惰性区。在细胞周期中表现为晚复制,早凝缩,即异固缩现象(heteropycnosis)。原核细胞与真核细胞特征分析染色体特性:分子结构相对稳定能够自我复制,使亲、子代之间保持连续性能够指导蛋白质的合成,从而控制整个生命过程能够产生可遗传的变异真核细
10、胞染色体的组成DNA 30%-40%组蛋白(histone) 30%-40%非组蛋白(NHP) 变化很大少量 RNA染色体中的蛋白质组蛋白(histone) :一类小的带有丰富正电荷(富含Lys、Arg)的核蛋白,与 DNA 有高亲和力。组蛋白是染色体的结构蛋白,它与 DNA 组成核小体。 组蛋白分为 H1、H2A、H2B、 H3 及 H4。 非组蛋白(non-histone protein):是染色体上与特异 DNA 序列结合的蛋白质,所以又称为序列特异性 DNA 结合蛋白。组蛋白具有如下特性:1、进化上的极端保守性。2、 无组织特异性。3、肽链上氨基酸分布的不对称性。4、组蛋白的修饰作用。
11、5、富含赖氨酸的组蛋白 H5。非组蛋白:非组蛋白大约占组蛋白总量的 6070%,种类很多。(1)HMG 蛋白(high mobility group protein) ,能与 DNA结合(不牢固) ,也能与 H1 作用,或与 DNA 超螺旋结构有关。(2)DNA 结合蛋白 :可能是一些与 DNA 的复制或转录有关的酶或调节物质。(3)A24 非组蛋白 :与 H2A 差不多,位于核小体内,功能不祥。非组蛋白的一般特性:1.非组蛋白的多样性;非组蛋白的量大约是组蛋白的 60%70% ,但它的种类却很多,约在 20-100 种之间,其中常见的有 15-20 种。2.非组蛋白的组织专一性和种属专一性。
12、DNAC 值:通常指一种生物单倍体基因组 DNA 的总量。C 值反常现象:真核细胞基因组的最大特点是它含有大量的重复序列,而且功能 DNA 序列大多被不编码蛋白质的非功能 DNA 所隔开,这就是著名的“C 值反常现象” 。染色体中的 DNA根据 DNA 的动力学研究,真核细胞 DNA 可分为:高度重复序列:几百几万 copy。如:卫星 DNA 和微卫星 DNA。中度重复序列:10 几百 copy。如:各种 rDNA、tDNA及组蛋白基因。低度重复序列:2 10 copy。如:血红蛋白。单拷贝序列:大多数编码蛋白质的结构基因和基因间间隔序列。只有一个拷贝。如:蛋清蛋白。染色体折叠DNA核小体螺线
13、管圆筒超螺旋(1)核小体染色质纤维细丝是许多核小体连成的念珠状结构。核小体(nucleosome) :DNA 绕在组蛋白八聚体(H2A、 H2B、H3、H4 各一对)核心外 1.8 周(146bp) ,形成核小体核心颗粒。(2)螺线管10nm 的染色质细丝盘绕成螺旋管状的 30nm 纤维粗丝,通称螺线管(solenoid) 。螺线管的每一螺旋包含 6 个核小体,其压缩比为 6。这种螺线管是分裂间期染色质和分裂中期染色体的基本组分。(3)上述螺线管可进一步压缩形成超螺旋。由 30nm 螺线管缠绕而成一细长、中空的圆筒,直径为 4 000nm,压缩比是 40。(4)超螺旋进一步压缩 1/5 便成为
14、染色体单体,总压缩比是 76405,将近一万倍。原核生物基因组 特点:1、结构简练2、存在转录单元 多顺反子 mRNA3、有重叠基因Sanger1977 在Nature上发表了 X174 DNA 的全部核苷酸序列,正式发现了重叠基因。第二节 DNA 的结构一、DNA 的一级结构所谓 DNA 的一级结构,就是指 4 种核苷酸的连接及其排列顺序,表示了该 DNA 分子的化学构成。基本特点DNA 分子是由两条互相平行的脱氧核苷酸长链盘绕而成的。DNA 分子中的脱氧核糖和磷酸交替连接,排在外侧,构成基本骨架,碱基排列在内侧。两条链上的碱基通过氢键相结合,形成碱基对,它的组成有一定的规律。这就是嘌呤与嘧
15、啶配对,而且腺嘌呤(A)只能与胸腺嘧啶(T)配对,鸟嘌呤( G)只能与胞嘧啶(C)配对。2、DNA 的二级结构DNA 的二级结构是指两条多核苷酸链反向平行盘绕所生成的双螺旋结构。通常情况下,DNA 的二级结构分两大类:一类是右手螺旋,如 A-DNA 和 B-DNA;另一类是左手螺旋,即 Z-DNA。3、DNA 的高级结构DNA 的高级结构是指 DNA 双螺旋进一步扭曲盘绕所形成的特定空间结构。超螺旋结构是 DNA 高级结构的主要形式,可分为正超螺旋与负超螺旋两大类。DNA 分子的超螺旋化可以用一个数学公式来表示:L=T+W 其中 L 为连接数(linking number) ,是指环形DNA
16、分子两条链间交叉的次数。只要不发生链的断裂,L 是个常量。T 为双螺旋的盘绕数(twisting number) ,W为超螺旋数(writhing number) ,它们是变量。23DNA 的复制2.3.1 DNA 的半保留复制机理2.3.2 复制的起点、方向和速度2.3.3 复制的几种主要方式一、DNA 的复制1、DNA 的半保留复制每个子代分子的一条链来自亲代 DNA,另一条链则是新合成的,所以这种复制方式被称为 DNA 的半保留复制(semiconservative replication) 。DNA 的这种半保留复制保证了 DNA 在代谢上的稳定性。2、复制的起点与方向一般把生物体的复
17、制单位称为复制子(replicon ) 。一个复制子只含一个复制起点。多复制子:DNA 复制时,原核生物一般只有一个起始位点,而真核生物则有多个起始位点,因而在复制时呈现多复制泡,也称为多复制子。DNA 的复制主要是从固定的起始点以双向等速复制方式进行的(图 2-18) 。复制叉以 DNA 分子上某一特定顺序为起点,向两个方向等速生长前进。拓扑异构酶 I:拓扑异构酶 I 解开负超螺旋,并与解链酶共同作用,在复制起点处解开双链。参与解链的除一组解链酶外,还有 Dna 蛋白等。DNA 解链酶(DNA helicase):DNA 解链酶能通过水解ATP 获得能量来解开双链 DNA。单链结合蛋白(SS
18、B 蛋白):SSB 蛋白的作用是保证被解链酶解开的单链在复制完成前能保持单链结构,它以四聚体形式存在于复制叉处,待单链复制后才掉下,重新循环。所以,SSB 蛋白只保持单链的存在,并不能起解链的作用。3、DNA 的半不连续复制 与冈崎片段DNA 复制时,短时间内合成的约 1000 个核苷酸左右的小片段,称之为冈崎片段(Okazaki fragment)DNA 复制过程中至少有一条链首先合成较短的片段,然后再由连接酶连成大分子 DNA。现在已知一般原核生物的冈崎片段要长些,真核生物中的要短些。进一步研究还证明,这种前导链的连续复制和滞后链的不连续复制在生物界是有普遍性的,因而称之为双螺旋的半不连续
19、复制。DNA 链的延伸:DNA 复制体(replisome) :在复制叉附近,形成了以两套DNA 聚合酶全酶分子、引发体和解链酶构成的类似核糖体大小的复合体,称为 DNA 复制体。4、滞后链的引发DNA 复制时,往往先由 RNA 聚合酶在 DNA 模板上合成一段 RNA 引物,再由 DNA 聚合酶从 RNA 引物 3 端开始合成新的 DNA 链。滞后链的引发过程往往由引发体(primosome)来完成。引发体由 6 种蛋白质n、n、n、Dna B、C 和 I 共同组成,只有当引发前体(preprimosome)把这 6 种蛋白质合在一起并与引发酶(primase)进一步组装后形成引发体,才能发
20、挥其功效。5、链的终止当复制叉前移,遇到 20bp 重复性终止子序列(Ter)时,Ter-Tus 复合物能阻挡复制叉的继续前移,等到相反方向的复制叉到达后在 DNA 拓扑异构酶 IV 的作用下使复制叉解体,释放子链 DNA。6、复制的几种方式(1)环状 DNA 双链的复制:环状双链 DNA 的复制可分为 型、滚环型和 D-环型几种类型。(a) 型 复制的起始点涉及到 DNA 双链的解旋和松开,形成两个方向相反的复制叉 。前导链 DNA 开始复制前,复制原点的核酸序列被转录生成短 RNA 链,作为起始 DNA复制的引物。(b) 滚环型(rolling circle )这是单向复制的特殊方式。如
21、X174 的双链环状DNA 复制型(RF)就是以这种方式复制的。DNA 的合成由对正链原点的专一性切割开始,所形成的自由 5 端被从双链环中置换出来并为单链 DNA 结合蛋白所覆盖,使其 3OH 端在 DNA 聚合酶的作用下不断延伸。在这个过程中,单链尾巴的延伸与双链 DNA 的绕轴旋转同步 。(c) D-环型(D-loop)这也是一种单向复制的特殊方式。这种方式首先在动物线粒体 DNA 的复制中被发现。双链环在固定点解开进行复制。但两条链的合成是高度不对称的,一条链上迅速合成出互补链,另一条链则成为游离的单链环(即 D-环) 。(2)线性 DNA 双链的复制线性 DNA 复制中 RNA 引物
22、被切除后,留下 5端部分单链 DNA,不能为 DNA 聚合酶所作用,使子链短于母链。T4 和 T7 噬菌体 DNA 通过其末端的简并性使不同链的 3端因互补而结合,其缺口被聚合酶作用填满,再经DNA 连接酶作用生成二联体。这个过程可重复进行直到生成原长 20 多倍的多联体,并由噬菌体 DNA 编码的核酸酶特异切割形成单位长度的 DNA 分子。二、原核和真核生物 DNA 的复制特点1、原核生物 DNA 的复制特点大肠杆菌 DNA 聚合酶 I、II 和 III 的性质比较原核生物的 DNA 聚合酶DNA 聚合酶:有 35外切酶活性和 53外切酶活性。保证 DNA 复制的准确性。DNA 聚合酶 :活
23、性低,其 35核酸外切酶活性可起校正作用。主要起修复 DNA 的作用。DNA 聚合酶:7 种亚单位 9 个亚基。只具 35外切酶活性,主导聚合酶。Klenow fragment:用枯草杆菌蛋白酶处理大肠杆菌 DNA聚合酶,获得两个片段,大片段分子量 76000U,称为Klenow 片段。它保留着聚合酶和 35外切酶的活性,广泛使用于 DNA 序列分析中。三、真核生物 DNA 的复制特点真核生物 DNA 复制的起始需要起始原点识别复合物(ORC)参与。真核生物 DNA 复制叉的移动速度大约只有 50bp 秒,还不到大肠杆菌的 120。真核生物的染色体在全部完成复制之前,各个起始点上DNA 的复制
24、不能再开始。真核生物 DNA 聚合酶的特性比较2.4.3 DNA 复制的调控原核细胞 DNA 的复制调控:复制叉的多少决定了复制频率的高低。真核细胞 DNA 的复制调控:1.细胞生活周期水平调控2.染色体水平调控3.复制子水平调控真核和原核生物 DNA 复制的比较相同:1.半保留复制2.都有引发、延长、终止三个阶段3.都必须有相应功能的蛋白质和 DNA 聚合酶参与区别:1.真:多个复制起始点;原:一个复制起始点2.真:所有复制受一种调控;原:一个复制子上有多个复制叉2.5 DNA 的修复DNA 修复系统 功能错配修复 恢复错配碱基切除修复 切除突变的碱基核苷酸切除修复 修复被破坏的 DNADN
25、A 直接修复 修复嘧啶二体或甲基化 DNA2.6 DNA 的转座2.6.1 转座子的分类和结构特征2.6.2 转座作用的机制2.6.3 转座作用的遗传学效应2.6.4 真核生物中的转座子移动基因(Movable gene):又称为转位因子 (Transposable elements),是存在于染色体 DNA 上可自主复制和位移的基本单位。由于它可以从染色体基因组上的一个位置转移到另一位置,甚至在不同染色体之间跃迁,因此有时也称为跳跃基因(Jumping gene)。原核生物的转座因子可分为:插入序列(insertion sequence, IS):最简单的不含有任何宿主基因的转位因子。片段长
26、度 7002500bp。复合转座子(transposon,Tn):是一类携带某些与转座无关的抗性基因(或其它宿主基因 )的转座子。分子量2000bp。转座噬菌体(Mu,D108):具有转座功能的一类可引起突变的溶源性噬菌体。 插入序列的结构特点:1.在 IS 两端含有长度为 1040bp 反向重叠序列2.含有一个编码转座酶的长编码区。3.插入时在 DNA 位点产生一个短的(39bp)正向重复序列。复合转座子的结构特点:1.两翼为两个相同或相似的 IS 序列。2.中部为某种抗性基因。3.IS 序列一般不能单独移动。Conclusiona) 转座过程是由 Donor 提供 Tn copy 到 ta
27、rget site, 涉及酶切、复制、重组的遗传学过程。b) 转座完成后,在 Tn 的两端出现 target site 序列的正向重复,其长度取决于 staggered cutting 的长度。c) 转座因子的 IR 序列是转座酶的重要识别位点,与转座,切除有关d) Cointegrater 是转座过程的中间体 (具有两个 Tn 和两个 replicon), 其稳定性依 Tn 不同而异,或 resolution 完成转座过程.e) Cointegrater 可能导致 Tn 和抗性的积累。转座作用的遗传学效应1. 诱变效应 (提高重组频率、形成易变基因)2. 切除效应 (倒位、缺失、重复、 fo
28、otprinting)3. 双转座效应(外显子改组 exon shuffling )4. 位置效应(启动表达、增强表达)5. 转座爆炸(激活表达、基因内重排突变基因形成)转位作用的机制:靶序列的复制。转位作用的遗传学效应:引起插入突变;产生新基因;产生染色体畸变;引起生物进化。转座因子的应用:利用转座子分离、克隆基因;利用 Tn进行基因定位;作为基因转移载体。真核生物中的转座子1、玉米中的控制因子自主性因子:具有自主剪接和转座的功能;非自主性因子:单独存在时是稳定的,不能转座,当基因组中存在与非自主性因子同家族的自主性因子时,它才具备转座功能,成为与自主性因子相同的转座子。AcDs 体系、Sp
29、m, En 转座子。2、果蝇中的转座子 Copia 类、P 转座子等。本章重点 染色体及 DNA 结构 DNA 复制习题1.DNA 以半保留方式进行复制,若一完全被标记的 DNA 分子,置于无放射标记的溶液中复制两代,所产生的 4 个 DNA分子中放射性状况如何A.两个分子有放射性,两个分子无放射性 B.均有放射性C.两条链中的半条具有放射性 D.两条链中的一条具有放射性 E.均无放射性2.DNA 复制时哪种酶不需要A.DNA 指导的 DNA 聚合酶 B.DNA 指导的 RNA 聚合酶 C.连接酶 D.RNA 指导的 DNA 聚合酶 E.拓扑异构酶3.原核生物的 DNA 聚合酶A.DNA 聚合
30、酶有 7 种、9 个亚单位 B.DNA 聚合酶有最强的外切核酸酶的活性 C.DNA 聚合酶是真正的起复制作用的酶D.催化过程产生的焦磷酸是主要底物 E.用 4 种脱氧核苷作底物生物信息的传递(上)从 DNA 到 RNA基因表达:是基因经过转录、翻译、产生有生物活性的蛋白质的整个过程。转录(transcription):以 DNA 为模板,按照碱基互补原则合成一条单链 RNA,从而将 DNA 中的遗传信息转移到RNA 中去的过程称为转录。编码链(coding strand)=有意义链模板链(template strand)=反义链不对称转录(asymmetric transcription):转
31、录仅发生在 DNA的一条链上。启动子(promoter):是 DNA 转录起始信号的一段序列,它能指导全酶与模板正确的结合,并活化酶使之具有起始特异性转录形式。终止子(terminator):转录终止的信号,其作用是在 DNA模板特异位置处终止 RNA 的合成。转录单位:DNA 链上从启动子直到终止子为止的长度称为一个转录单位。3.1 RNA 的转录转录的基本过程都包括:模板识别、转录起始、通过启动子及转录的延伸和终止。1、模板识别阶段主要指 RNA 聚合酶与启动子 DNA 双链相互作用并与之相结合的过程。转录起始前,启动子附近的 DNA 双链分开形成转录泡以促使底物核糖核苷酸与模板 DNA
32、的碱基配对。2、转录起始就是 RNA 链上第一个核苷酸键的产生。3、转录起始后直到形成 9 个核苷酸短链是通过启动子阶段,通过启动子的时间越短,该基因转录起始的频率越高。4、RNA 聚合酶离开启动子,沿 DNA 链移动并使新生RNA 链不断伸长的过程就是转录的延伸。5、当 RNA 链延伸到转录终止位点时,RNA 聚合酶不再形成新的磷酸二酯键,RNA-DNA 杂合物分离,这就是转录的终止。3.1.1 转录的基本过程RNA 合成的基本特点:1.底物是:ATP、GTP、CTP、UTP2.在聚合酶作用下形成磷酸酯键3.RNA 的碱基顺序由 DNA 的顺序决定4.仅以一条 DNA 链作为模板5.合成方向
33、为 536.合成中不需要引物3.1.2 转录机器的主要成分原核生物 RNA 聚合酶: 1、RNA 聚合酶:大多数原核生物 RNA 聚合酶的组成是相同的,大肠杆菌 RNA 聚合酶由 2 个 亚基、一个 亚基、一个 亚基和一个 亚基组成,称为核 74 心酶。加上一个 亚基后则成为聚合酶全酶(holoenzyme ) ,相对分子质量为 4.65105。研究发现,由 和 亚基组成了聚合酶的催化中心,它们在序列上与真核生物RNA 聚合酶的两个大亚基有同源性。 亚基能与模板DNA、新生 RNA 链及核苷酸底物相结合。 因子可以极大地提高 RNA 聚合酶对启动子区 DNA 序列的亲和力,加入 因子以后,RN
34、A 聚合酶全酶识别启动子序列的特异性总共提高了 107 倍。 因子的作用是负责模板链的选择和转录的起始,转录的起始从化学过程来看是单个核苷酸与开链启动子-酶复合物相结合构成新生 RNA 的 5端,再以磷酸二酯键的形式与第二个核苷酸相结合,起始的终止反映在 因子亚基基因 相对分子量亚基数组分 功能 rpoA 3.6510 42 核心酶 核心酶组装,启动子识别 rpoB 1.5110 51 核心酶 和 共同形成 RNA 合成的活性中心rpoC 1.55105 1 核心酶 ?111041 核心酶 未知 rpoD 7.010 41 因子 存在多种 因子,用于识别不同的启动子的释放。过去认为二核苷酸的形
35、成就是转录起始的终止,实际上,只有当新生 RNA 链达到 6-9 个核苷酸时才能形成稳定的酶-DNA-RNA 三元复合物,才释放 因子,转录进入延伸期。真核生物 RNA 聚合酶真核生物中共有 3 类 RNA 聚合酶。真核生物 RNA 聚合酶一般有 8-14 个亚基所组成,相对分子质量超过5105。除了细胞核中的 RNA 聚合酶之外,真核生物线粒体和叶绿体中还存在着不同的 RNA 聚合酶。线粒体 RNA 聚合酶只有一条多肽链,相对分子质量小于 7104,是已知最小的 RNA 聚合酶之一,与 T7 噬菌体 RNA 聚合酶有同源性。叶绿体 RNA 聚合酶比较大,结构上与细菌中的聚合酶相似,由多个亚基
36、组成,部分亚基由叶绿体基因组编码。线粒体和叶绿体 RNA 聚合酶活性不受 -鹅膏覃碱所抑制。 常用的转录抑制剂及其作用:抑制剂 靶酶 抑制作用利福霉素 细菌的全酶 与 亚基结合,阻止起始链霉溶菌素 细菌的核心酶 与 亚基结合,阻止延长放线菌素 D 真核 RNA 聚合酶与 DNA 结合,并阻止延长-鹅膏蕈碱真核 RNA 聚合酶与 RNA 聚合酶结合,起始复合物的形成转录可被分为 4 个阶段,即启动子的选择、转录起始、RNA 链的延伸和终止。原核生物中:启动子选择阶段包括 RNA 聚合酶全酶对启动子的识别,聚合酶与启动子可逆性结合形成封闭复合物(closed complex) 。真核生物 RNA
37、聚合酶所形成的转录起始复合物:除了RNA 聚合酶之外,真核生物转录起始过程中至少还需要7 种辅助因子参与。一般情况下,该复合物可以进入两条不同的反应途径,一是合成并释放 2-9 个核苷酸的短 RNA 转录物,即所谓的流产式起始;二是尽快释放 亚基,转录起始复合物通过上游启动子区并生成由核心酶、DNA 和新生 RNA 所组成的转录延伸复合物。RNA 聚合酶的核心酶虽可合成 RNA,但不能找到模板DNA 上的起始位点。只有带 因子的全酶才能专一地与 DNA 的启动子结合,选择其中一条链作为模板,合成均一的产物。 因子的作用只在起始,一旦转录开始,它就脱离了起始复合物,而由核心酶负责 RNA 链的延
38、伸。因此,聚合酶全酶的作用是启动子的选择和转录的起始,而核心酶的作用是链的延伸。真核生物 RNA Pol II 的转录起始复合物真核生物转录起始除 RNA 聚合酶外,至少还需要 7 种辅助因子参与,如TBP,TFIIA,TFIIB,TFIID,TFIIE,TFIIF 和 TFIIH。3.2 启动子与转录起始2、启动子与转录起始启动子是一段位于结构基因 5端上游区的 DNA 序列,能活化 RNA 聚合酶,使之与范本 DNA 准确地相结合并具有转录起始的特异性。转录的起始是基因表达的关键阶段,而这一阶段的重要问题是 RNA 聚合酶与启动子的相互作用。3.2.1 启动子区的基本结构转录单元(tran
39、scription unit):是一段从启动子开始至终止子结束的 DNA 序列,RNA 聚合酶从转录起点开始沿着模板前进,直到终止子为止,转录出一条 RNA 链。转录起点是指与新生 RNA 链第一个核苷酸相对应 DNA链上的碱基,研究证实通常为一个嘌呤。常把起点前面,即 5末端的序列称为上游(upstream),而把其后面即 3末端的序列称为下游(downstream)。在启动子区内有一个由 5 个核苷酸组成的共同序列,是RNA 聚合酶的紧密结合点,现称为 Pribnow 区(Pribnow box),该区的中央约位于起点上游 10bp 处,故又称-10 区。绝大部分启动子都存在位于-10bp
40、 处的 TATA 区和-35bp处的 TTGACA 区。这两段共同序列是 RNA 聚合酶与启动子的结合位点,能与 因子相互识别而具有很高的亲和力。Pribnow 区(Pribnow box)这个区的中央大约位于起点上游 10bp 处,所以又称为10 区。TTGACA。这个区的中央大约位于起点上游 35bp 处,所以又称为35 区。10 位的 TATA 区和35 位的 TTGACA 区是 RNA 聚合酶与启动子的结合位点,能与 因子相互识别而具有很高的亲和力。在真核生物基因中,Hogness 等先在珠蛋白基因中发现了类似 Pribnow 区的 Hogness 区(Hogness box) ,这是
41、位于转录起始点上游2530 bp 处的共同序列 TATAAA,也称为 TATA 区(图 3-7) 。另外,在起始位点上游7078 bp 处还有另一段共同序列 CCAAT,这是与原核生物中35 bp 区相对应的序列,称为 CAAT 区(CAAT box) 。在7080 区含有 CCAAT 序列(CAAT box) ,在80110 含有 GCCACACCC 或 GGGCGGG 序列(GC box) 。3.2.2 启动子区的识别氢键互补学说:RNA 聚合酶并不直接识别碱基对本身,而是通过氢键互补的方式加以识别。这种氢键互补学说较为圆满地解释了启动子功能既受DNA 序列影响,又受其构象影响这一事实。3
42、.2.3 酶与启动子区的结合在 RNA 聚合酶与启动子相互作用的过程中,聚合酶首先与启动子区闭合双链 DNA 相结合,形成二元闭合复合物,然后经过解链得到二元开链复合物。DNA 开链是按照 DNA 模板序列正确引入核苷酸底物的必要条件。RNA 聚合酶既是双链 DNA 结合蛋白,又是单链 DNA 结合蛋白。3.2.4 -10 区和-35 区的最佳间距在原核生物中,-35 区与-10 区之间的距离大约是1619bp,小于 15bp 或大于 20bp 都会降低启动子的活性。在细菌中常见两种启动子突变,一种叫下降突变(down mutation),如果把 Pribnow 区从 TATAAT 变成 AA
43、TAAT就会大大降低其结构基因的转录水平;另一类突变叫上升突变(up mutation),即增加 Pribnow 区共同序列的同一性。3.2.5 增强子及其功能能强化转录起始的序列为增强子或强化子(enhancer)。增强子很可能通过影响染色质 DNA-蛋白质结构或改变超螺旋的密度而改变模板的整体结构,从而使得 RNA 聚合酶更容易与范本 DNA 相结合,起始基因转录。增强子与启动子的区别:1.增强子对于启动子的位置不固定,而能有很大的变动;2.它能在两个方向产生作用。一个增强子并不限于促进某一特殊启动子的转录,它能刺激在它附近的任一启动子。3.2.6 真核生物启动子对转录的影响习惯上,将 T
44、ATA 区上游的保守序列称为上游启动子元件(upstream promoter element,UPE) 或称上游激活序列(upstream activating sequence,UAS)。在真核生物基因中,Hogness 等先在珠蛋白基因中发现了类似 Pribnow 区的 Hogness 区(Hogness box) ,这是位于转录起始点上游2530 bp 处的共同序列 TATAAA,也称为 TATA 区。另外,在起始位点上游7078 bp 处还有另一段共同序列 CCAAT,这是与原核生物中35 bp 区相对应的序列,称为 CAAT 区(CAAT box) 。在7080 区含有 CCAAT
45、 序列(CAAT box) ,在80110 含有 GCCACACCC 或 GGGCGGG 序列(GC box) 。TATA 区的主要作用是使转录精确地起始;CAAT 区和 GC 区主要控制转录起始频率,基本不参与起始位点的确定。转录实际上是 RNA 聚合酶、转录调控因子和启动子区各种调控元件相互作用的结果。转录的终止RNA 聚合酶起始基因转录后,它就会沿着范本 53方向不停地移动,合成 RNA 链,直到碰上终止信号时才与模板 DNA 相脱离并释放新生 RNA 链。终止发生时,所有参与形成 RNA-DNA 杂合体的氢键都必须被破坏,范本 DNA 链才能与有意义链重新组合成 DNA 双链。3.4
46、终止和抗终止不依赖于 因子的终止终止位点上游一般存在一个富含 GC 碱基的二重对称区,由这段 DNA 转录产生的 RNA 容易形成发卡式结构。在终止位点前面有一段由 4-8 个 A 组成的序列,所以转录产物的 3端为寡聚 U,这种结构特征的存在决定了转录的终止。终止效率与二重对称序列和寡聚 U 的长短有关,随着发卡式结构(至少 6bp)和寡聚 U 序列(至少 4 个U)长度的增加,终止效率逐步提高。依赖于 因子的终止 因子是一个相对分子质量为 2.0105 的六聚体蛋白,它能水解各种核苷酸三磷酸,实际上是一种 NTP 酶,它通过催化 NTP 的水解促使新生 RNA 链从三元转录复合物中解离出来
47、,从而终止转录。3.4.3 抗终止抗转录终止主要有两种方式:1.破坏终止位点 RNA 的茎环结构2.依赖于蛋白质因子的转录抗终止3.3 原核生物与真核生物 mRNA 的特征比较原核生物 mRNA 的特征mRNA 在大肠杆菌细胞内占总 RNA 的 2%左右(tRNA 占 16%,而 rRNA 则占 80%以上) 。原核生物中,mRNA 的转录和翻译不仅发生在同一个细胞空间里,而且这两个过程几乎是同步进行的,蛋白质合成往往在 mRNA刚开始转录时就被引发了。一个原核细胞的 mRNA(包括病毒)有时可以编码几个多肽。3.3.1 原核生物 mRNA 的特征1.原核生物 mRNA 的半衰期短2.许多原核
48、生物 mRNA 以多顺反子的形式存在3.原核生物 mRNA 的 5端无帽子结构,3端没有或只有较短的 poly(A)结构4.原核生物起始密码子 AUG 上游 7-12 个核苷酸处有一被称为 SD 序列(Shine Dalgarno sequence)的保守区,因为该序列与 16S-rRNA 3端反向互补,所以被认为在核糖体-mRNA 的结合过程中起作用。只编码一个蛋白质的 mRNA 称为单顺反子mRNA(monocistronic mRNA) ,把编码多个蛋白质的 mRNA 称为多顺反子mRNA(polycistronic mRNA) 。多顺反子 mRNA 是一组相邻或相互重迭基因的转录产物,这样的一组基因可被称为一个操纵子(operon) ,是生物体内的重要遗传单位。如大肠杆菌乳糖操纵子转录成编码3 条多肽的多顺反子 mRNA,经过翻译生成 半乳糖苷酶、透过酶及乙酰基转移酶。真核生物 mRNA 的特征前体 RNA 成熟 mRNA“基因”的分子生物学定义是:产生一条多肽链或功能RNA 所必需的全部核苷酸序列!3.3.2 真核生物 mRNA 的特征1. 真核