1、第二章:DNA 的结构与功能一、DNA 的一级结构1953 年 Watson 和 Crick 创立的 DNA 双螺旋结构模型,阐明了 DNA 分子的结构特征,提出 DNA 是遗传分子。DNA 的一级结构:是指 4 种核苷酸的连接及排列顺序,表示了 DNA 分子的化学构成。四种脱氧核糖核苷酸分别表示为:dAMP、dGMP、dTMP 、dCMP。DNA 分子是由这四种不同的脱氧核苷酸,通过3,5-磷酸二酯键连接而成的直链分子。1DNA 分子的多样性:组成 DNA 分子的碱基虽然只有四种,但是,由于碱基可以任何顺序排列,而构成了 DNA 分子的多样性。如:某一 DNA 分子是由 100 个 bp 组
2、成,它们的可能排列方式就是 4100。实际上 DNA 链中的碱基数远远超出 100 个,所以,它们的排列方式几乎是无限的。即生物的多样性。因此,DNA 中的碱基排列顺序是 DNA 分子的重要属性。对一种 DNA 属性的最基本了解就是测定其碱基的排列顺序一级结构。二、DNA 的物理图谱DNA 的物理图谱:是 DNA 分子的限制性内切酶酶解片段的排列顺序,也就是在 DNA 片段上标记出限制性内切酶的位点顺序。假设有一段 DNA 片段为 2450bp,分别有两个 XbaI 和两个 PstI 位点,这样每一个单酶切会把此 DNA 分子切成 3 个片段,双酶切将产生 5 个片段。三、DNA 一级结构的测
3、定双脱氧末端终止法-Sanger 法:原理是采用核苷酸链终止剂 2,3,-双脱氧核苷酸终止 DNA 的延长。由于它缺少形成 3,5,磷酸二脂键所需要的 3,-OH,一旦参入到 DNA 链中,此 DNA 链就不能进一步延长。根据碱基配对原则,每当 DNA 聚合酶需要 dNMP 参入到正常延长的 DNA 链中时,就有两种可能性,一是参入 ddNTP,结果导致脱氧核苷酸链延长的终止;二是参入 dNTP,使 DNA 链仍可继续延长,直至参入下一个 ddNTP。根据这一方法,就可得到一组以 ddNTP 结尾的长短不一的 DNA 片段 DNA 序列分析,将反应体系分成 4 组,每一组反应体系中加入 4 种
4、脱氧核苷三磷酸和一种相应的双脱氧核苷三磷酸,反应后可得到不同长度的以双脱氧结尾的 DNA 片段,各 DNA 片段均只相差一个核苷酸长度,各组的片段经凝胶电泳分离后,每一片段的电泳位置不同,从下而上(由小到大)可直接读出 DNA 序列。四、DNA 的双螺旋结构Watson 和 Crick 于 1953 年根据 DNA 纤维 X 射线晶体衍射图及其它试验资料,提出了 DNA 为右手双螺旋结构的科学假设,随后证明他们提出的 DNA 构象是 DNA 分子最为常见的结构,通常称为 B 型 DNA。而DNA 分子的结构不是固定不变的,在不同的环境因素,都可促使 DNA 分子形成不同的构象。通常情况下可分为
5、两大类:一类是右手螺旋,如、B-DNA、C-DNA 、D-DNA、E-DNA 、A-DNA;另一类是局部的左手螺旋,即 Z-DNA。B-DNA、A-DNA、Z-DNA 的主要区别:1、A-DNA 更紧密,每个碱基平面距离为 0.256nm,每圈螺旋有 11 对碱基,螺距为 2.8nm;B-DNA 碱基距离为 0.338nm,每圈螺旋有 10 对碱基,螺距为 3.4nm。2、C 和 G 之间核苷酸中脱氧核糖的折叠不同, A-DNA 是 C3在内,B-DNA 是 C2在内。3、B-DNA 大沟、小沟的深度基本是一致的,只是大沟较宽;A-DNA 大沟变窄、变深,小沟变宽、变浅。4、Z-DNA 糖-磷
6、酸主链的走向呈 “之”字形,分子呈左手螺旋构象。5、 Z-DNA 较 B-DNA 细而舒展,螺旋直径为 1.8nm,每个碱基平面距离是 0.37nm,每圈含 12 对碱基,螺距为 4.5nm。6、Z-DNA 是 C3在内与 A-DNA 相同。7、Z-DNA 仅有一条小沟,且较深,含有较高的负电荷密度。Z DNA 的形成是 DNA 单链上出现嘌呤与嘧啶交替排列所成的。比如 CGCGCGCG 或者CACACACA。五、DNA 的三股螺旋结构DNA 三股螺旋结构概念是在 1957 年提出来得,至 1987 年在质粒的酸性溶液中发现了分子内的三股螺旋DNA,将此种构型的 DNA 称为 H-DNA。它是
7、双螺旋 DNA 分子中一条链的某一节段,通过链的折叠与同一分子中 DNA 嘌呤嘧啶双螺旋(其中一条链只有嘌呤 AG,另一条链只有嘧啶 CT)节段结合而形成的。DNA 形成一种分子间的三股螺旋 DNA,从而可在转录水平上阻止基因的转录。这就是反基因策略,或称反基因技术。六、DNA 超螺旋结构超螺旋结构是 DNA 分子高级结构的主要形式,可分为正超螺旋与负超螺旋两类,一般 DNA 双螺旋结构中每圈是 10 个 bp ,大于或小于 10 会出现正或负超螺旋结构,环状 DNA 分子常以超螺旋结构存在,并以负超螺旋为主,有利于转录的起始。七、核小体与染色体核小体:DNA 双螺旋链,等距离缠绕组蛋白(H2
8、A、H2B、H3、 H4)各二分子组成八聚体形成众多核心颗粒, 外绕 1.75 圈左走向的 DNA 链,每圈约 85bpDNA,各颗粒之间为带有 H1 组蛋白的连接区 DNA。1、组蛋白特征进化上极端保守性:不同种生物组蛋白的氨基酸组成是十分相似的。无组织特异性:仅有鸟类、鱼类、两栖类红细胞染色体不含 H1 而带有 H5。钛链上氨基酸分布的不均匀性:碱性氨基酸集中分布在 N 端,而大部分疏水基团分布在 C 端。组蛋白的修饰作用包括:甲基化、乙酰化、磷酸化,富含赖氨酸和精氨酸:H5 还富含丙氨酸、丝氨酸。2、非组蛋白HMG 蛋白(High Mobility Group Protein):分子量小
9、 3x104 以下电泳迁移快而得名,易用低盐溶液0.35mol 抽提,其功能可能与 DNA 的超螺旋结构有关。DNA 结合蛋白:是一些与 DNA 复制或转录有关的酶或调节物质,需用 2molNaCl 和 5mol 尿素才能解离。A24 非组蛋白:用 0.2mol 硫酸从小鼠肝脏中分离得到,位于核小体内,功能不详。八、DNA 结构的不均一性反向重复序列(inverted repeats) 又称回文序列(palindrome) ,它能在 DNA 或 RNA 中形成发夹结构。这种回文结构通常是作为一种特别信号,如限制性核酸内切酶及调节蛋白的识别位点,转录终止信号等。富含A/T 的序列:在很多有重要调
10、节功能的 DNA 区段都富含 AT 特别是在复制起点和启动子的 Pribnow 框(真核生物为 TATA 框)的序列中,其对于复制和起始十分重要。因为 AT 对只有二条氢键,此处的双链较 GC 对处易于解开,有利于起始复合物的形成。九、DNA 的变性、复性和分子杂交1、DNA 的变性(denaturation) :在加热、碱性等条件下,A-T,G-C 氢键断裂,形成单链结构。DNA 在溶液中发生变性伴随着一系列理、化性质的改变。紫外吸收强度增加;溶液粘度降低;沉降速度增加等。紫外吸收强度的增加与变性(解链)程度成正比;DNA 的热变性常称为 DNA 的“ 融解”,解链曲线的中点所示的温度称为
11、Tm 或称为融点,Tm 表示使 50% DNA 分子解链的温度。不同种类 DNA 有不同的解链曲线,也有不同的 Tm,Tm 随(G + C )% 含量呈线性增加。2、DNA 的复性:去除变性条件后,DNA 可以回复成双链结构,恢复原有的物理化学特征和生物学活性,称为 DNA 复性(renaturation)。热变性 DNA 一般经缓慢冷却后即可复性,此过程称为退火(annealing)。 3、核酸的分子杂交:用放射性同位素或荧光素及其他物质标记的已知核酸片段或寡聚核苷酸作为探针,借助探针探测分析未知的核酸样品。 称为 Southern 印迹分析。Northern 印迹分析:根据 Souther
12、n 的原理,用已知 DNA 作探针,分析检测 RNA 的方法。菌落或噬菌斑原位杂交:将硝酸纤维素膜置于布满细菌菌落或噬菌斑的平板上,使平板上每一菌落的一些细菌或噬菌斑的一些 DNA 粘到硝酸纤维素膜上,形成平板的一个复制品,然后用碱处理,让细菌裂解,DNA 变性,就在原位固定于硝酸纤维素膜上,再进行分子杂交。十、基因与基因组基因:一般是指表达一种蛋白质或功能 RNA 的遗传物质的基本单位。基因组:是指某种生物所包含的全套基因。如:原核生物结构简单只有一个染色体,所有的基因都在这条染色体上,即构成该生物的基因组。随着生物的进化基因组的数值(基因组 C 值)随之增加,人类的基因组是包含在 23 对
13、染色体中的所有基因,其单倍体基因组的 C 值在 3 x 109 bp;病毒含 103105bp;细菌含 105107bp。基因与蛋白质:假定平均以 1000bp(1kb)编码一个蛋白质,最小的病毒可含 45 个基因;大肠杆菌含30004000 个基因;而高等生物的染色体则可含有 10 万个以上基因。 按理论计算人类应有 200300 万个基因(3 x 109 bp ),实际只有 10 万个左右,因为含有非编码序列和隔离序列及尚不知功能序列;病毒的基因数要比计算所得的大,因有基因重叠现象。(一)、原核基因组原核基因组主要包括病毒基因组和属于原核生物的细菌基因组。1、病毒基因组:病毒(包括噬菌体)
14、DNA 分子是最小的,最小的病毒基因组仅有 5kb 左右,最大的有200kb 左右。有些病毒的基因组不够编码自己的蛋白质,如 x174 要编码 9 个蛋白质(至少需要 9kb),而基因组仅有 5kb 左右,为解决这一矛盾,就出现了基因重叠现象,如 A 基因和 B 基因的重叠:2、细菌基因组:细菌基因组含有染色体和染色体外的 DNA质粒。质粒(plasmid):是独立于染色体之外的双链环状 DNA 分子,含有遗传信息能进行自主复制,并传至子代细胞,小的质粒仅有几个 kb,大的有 500kb,每个质粒都有一段 DNA 复制起始位点的序列,用于克隆的载体。1)质粒的特点a. 是染色质外的双链共价闭合
15、环形 DNA(covalently closed circuar DNA,cccDNA),可自然形成超螺旋结构,不同质粒大小在 2-300 kb 之间, 15kb 的质粒比较容易分离纯化,15kb 的质粒则不易提取。b. 能自主复制,是能独立复制的复制子(autonomous replicon)。一般质粒 DNA 复制的质粒可随宿主细胞分裂而传给后代。c. 每个质粒 DNA 上都有复制的起点,只有 ori 能被宿主细胞复制蛋白质识别的质粒才能在该种细胞中复制。d. 质粒对宿主生存并不是必需的e. 细菌中许多天然的质粒带有抗药性基因。如编码合成能分解破坏四环素、氯霉素、氨芐氰霉素等的酶基因,这种
16、质粒称为抗药性质粒,又称 R 质粒,带有 R 质粒的细菌就能在相应的抗生素存在生存繁殖。所以质粒对宿主不是寄生的,而是共生的。细菌的抗药性,常与 R 质粒在细菌间的传播有关, F 质粒能促使这种传递。分子生物学使用的质粒载体是经过了许多的人工的改造。如:pBR322 及 pUC18。2) 细菌基因组的结构特征 a. 功能上相关的基因串联在一起组成操纵子结构,受同一个启动子调控,几个基因转录在同一条 mRNA上,形成多顺反子 mRNA。b. 基因组中不存在内含子,基因是连续的。不存在不连续基因,转录后无须进行加工修饰,直接可以翻译。c. 基因组的大部分是编码区,只有小部分是非翻译区,其中包括调控
17、部分。d. 少数基因有基因重叠现象。(二)、真核基因组真核基因组结构特征:真核基因组的最大特点是它含有大量的重复序列,在脊椎动物中 90%左右是非编码序列,而且编码序列大多数被不编码蛋白质的非功能 DNA 所隔开,称为割裂基因,非编码的内含子则存在广泛的序列变异,说明内含子中的大部分序列是无功能的。1、重复序列:在 DNA 中有一段碱基序列多次重复出现。根据重复出现的次数可分为:高度重复序列、中度重复序列、单拷贝基因。1)高度重复序列:一般由较短的序列组成,常集中在一起,串联排列,重复次数可高达几百万次。将这种高度重复序列常称为卫星 DNA 。在真核基因组 DNA 中的 G :C 碱基对的分布
18、与细菌中不同,是不均一的,由于有这种碱基组分分布的不均一,在 CsCl 等密度剃度超离心分离后,出现一个主峰和 12 个小峰,这种小峰对主峰而言尤似主峰的卫星,所以称卫星 DNA,它是多种短重复序列的混合物,人们按照重复序列的长短将卫星 DNA 分成 3 类:a、卫星 DNA:重复序列长度在 100bp 左右,主要存在于异染色体近中心粒和端粒,在人群中多态性不强。b、小卫星 DNA:重复序列长度在 1570bp,主要存在于常染色体中,在人群中有高度多态性。 c、微卫星 DNA:重复序列长度在 26bp,但串联起来的总长度有高度变化,这种长度的多态性是由于精卵结合在减数分裂过程中发生不相等的交叉
19、重复造成的,使它的长度在每一个个体中就有差别,这是进行 DNA 指纹分析的基础。2)中度重复序列:这类重复序列的重复次数在 10104bp 之间。 如各种 rRNA、tRNA 等基因属于这一类。3)、单拷贝基因:基因组中仅出现一次的基因称为单拷贝基因。2、基因割裂现象:单拷贝基因都是编码蛋白质的基因,大多数不连续的,即基因内部含有非编码序列-内含子,和编码部分-外显子,这种割裂基因是真核生物的普遍现象。内含子有一个共同的特征:5/ 端以 GT 开始,3/ 端以 AG 结束,称为 GT/AG 规则。3、一个基因编码两种以上的 mRNA:在原核生物中,由于相关基因串联在一起构成操纵子,产生多顺反子
20、 mRNA,翻译出多种蛋白质。在真核生物中没有操纵子结构,每个基因都单独构成一个转录单位,产生单顺反子 mRNA,仅编码一种蛋白质。编码两种以上的 mRNA 主要是通过拼接方式来完成的。4、基因家族:来自一个祖先基因,通过扩增形成多个结构和功能相关的基因,称为。所编码的蛋白质是同源的。如:组蛋白基因家族,有 5 个成员,即 HI、H2A、H2B、H3、H4。5、假基因:来源同一个祖先基因但不具有转录功能,不能产生有功能的 mRNA。而这些尚失功能的扩增基因仍留在基因家族中,这种基因称为。不具内含子,推测可能来源于 cDNA 。6、限制性片段长度多态性:(Restriction Fragment Length Polymorphism ,RFLP)DNA 顺序发生了突变,使突变所在部位的某种限制性内切酶的位点发生改变。这样,利用该限制性内切酶消化此 DNA 时,便会产生与正常不同的限制性片段。这样,在同种生物的不同个体中会出现不同长度的限制性片段类型 。