1、第二讲 染色体与DNA,一、 DNA的组成与结构二、 DNA聚合酶与DNA的合成三、 DNA的生理意义及成分分析 四. C-Value和Cot1/2五、 染色体结构六、 染色体的组成 七. 原核与真核染色体DNA比较,一、 DNA的组成与结构,Avery在1944年的研究报告中写道:“当溶液中酒精的体积达到9/10时,有纤维状物质析出。如稍加搅拌,它就会象棉线在线轴上一样绕在硬棒上,溶液中的其它成份则呈颗粒状沉淀。溶解纤维状物质并重复数次,可提高其纯度。这一物质具有很强的生物学活性,初步实验证实,它很可能就是DNA(谁能想到!)”。对DNA分子的物理化学研究导致了现代生物学翻天覆地的革命,这更
2、是Avery所没有想到。,DNA的一级结构: 就是指4种核苷酸的连接及其排列顺序,表示了该DNA分子的化学构成。,核苷酸序列对DNA高级结构的形成有很大影响。 例如: B-DNA中多聚(G-C)区易出现左手螺旋 DNA(Z-DNA); 反向重复的DNA片段易出现发卡式结构等 。,DNA不仅具有严格的化学组成,还具有特殊的高级结构,它主要以有规则的双螺旋形式存在,其基本特点是:,1、DNA分子是由两条互相平行的脱氧核苷酸长链盘绕而成的。2、DNA分子中的脱氧核糖和磷酸交替连接,排在外侧,构成基本骨架,碱基排列在内侧。,3、两条链上的碱基通过氢键相结合,形成碱基对,它的组成有一定的规律。 这就是嘌
3、呤与嘧啶配对,而且腺嘌呤(A)只能与胸腺嘧啶(T)配对,鸟嘌呤(G)只能与胞嘧啶(C)配对。如一条链上某一碱基是C,另一条链上与它配对的碱基必定是G。碱基之间的这种一一对应的关系叫碱基互补配对原则。 组成DNA分子的碱基虽然只有4种,它们的配对方式也只有A与T,C与G两种,但是,由于碱基可以任何顺序排列,构成了DNA分子的多样性。 例如,某DNA分子的一条多核苷酸链有100个不同的碱基组成,它们的可能排列方式就是4100 。,The accuracy of translation relies on the specificity of base pairing. The actual rat
4、e in bacteria seems to be -10-8-10-10. This corresponds to -1 error per genome per 1000 bacterial replication cycles, or -10-6 per gene per generation.,DNA polymerase might improve the specificity of complementary base selection at either (or both) of two stages:,It could scrutinize the incoming bas
5、e for the proper complementarity with the template base; for example, by specifically recongnizing matching chemical features. This would be a presynthetic error control. Or it could scrutinize the base pair after the new base has been added to the chain, and, in those cases in which a mistake has b
6、een made, remove the most recently added base. This would be a proofreading control.,含氮碱基,焦磷酸,键形成,二、 DNA聚合酶与DNA的合成,三、DNA的生理意义及成分分析,早在1928年英国科学家Griffith等人就发现肺炎链球菌使小鼠残废的原因是引起肺炎。细菌的毒性(致病力)是由细胞表面荚膜中的多糖所决定的。具有光滑外表的S型肺炎链球菌因为带有荚膜多糖而都能使小鼠发病,而具有粗糙外表的R型因为没有荚膜多糖而失去致病力(荚膜多糖能保护细菌免受运动白细胞攻击)。,首先用实验证明基因就是DNA分子的是美国著
7、名的微生物学家Avery。Avery等人将光滑型致病菌(S型)烧煮杀首先用实验证明基因就是DNA分子的是美国著名的微生物学家Avery。Avery等人将光滑型致病菌(S型)烧煮杀灭活性以后再侵染小鼠,发现这些死细菌自然丧失了致病能力。再用活的粗糙型细菌(R型)来侵染小鼠,也不能使之发病,因为粗糙型细菌天然无致病力。当他们将经烧煮杀死的S型细菌和活的R型细菌混合再感染小鼠时,实验小鼠每次都死了。解剖死鼠,发现有大量活的S型(而不是R型)细菌。他们推测,死细菌中的某一成分棗转化源(transforming principle)将无致病力的细菌转化成病原细菌。,美国冷泉港卡内基遗传学实验室科学家He
8、rshey和他的学生Chase在1952年从事噬菌体侵染细菌的实验。噬菌体专门寄生在细菌体内。它的头、尾外部都有由蛋白质组成的外壳,头内主要是DNA。噬菌体侵染细菌的过程可以分为以下5个步骤:噬菌体用尾部的末端(基片、尾丝)吸附在细菌表面;噬菌体通过尾轴把DNA全部注入细菌细胞内,噬菌体的蛋白质外壳则留在细胞外面;噬菌体的DNA一旦进入细菌体内,它就能利用细菌的生命过程合成噬菌体自身的DNA和蛋白质;新合成的DNA和蛋白质外壳,能组装成许许多多与亲代完全相同的子噬菌体;子代噬菌体由于细菌的解体而被释放出来,再去侵染其他细菌。他们发现被感染的细菌中带有70%的噬菌体DNA,但只带有20%的噬菌体
9、蛋白质。子代噬菌体中带有50%标记的DNA,却只有1%的标记蛋白质。,四. C-Value和Cot1/2,The total amount of DNA in the haploid genome is a characteristic of each living species known as C-value.,Cot1/2 is the product of concentration and time required for 50% reassociation given in nucleotide-moles second/liter.,五、 染色体结构,DNA molecule
10、s are the largest macromolecules in the cell and are commonly packaged into structures called “chromosomes”, most bacteria & viruses have a single chromosome where as Eukaryotic cells usually contain many.,任何一条染色体上都带有许多基因,一条高等生物的染色体上可能带有成千上万个基因,一个细胞中的全部基因序列及其间隔序列统称为genomes(基因组)。 Genotype (基因型): The
11、genetic constitution of a given organism (指某个特定生物体细胞内的全部遗传物质)。Phenotype (表现型): Visible property of any given organism (某个特定生物体中可观察到的物理或生理现象)。Mutations(突变): 染色体DNA中可遗传的核苷酸序列变化。,端粒,端粒,着丝粒,六、 染色体的组成,1染色质和核小体 染色质DNA的Tm值比自由DNA高,说明在染色质中DNA极可能与蛋白质分子相互作用;在染色质状态下,由DNA聚合酶和RNA聚合酶催化的DNA复制和转录活性大大低于在自由DNA中的反应;DNA
12、酶I(DNaseI)对染色质DNA的消化远远慢于对纯DNA的作用。染色质的电子显微镜图显示出由核小体组成的念珠状结构,可以看到由一条细丝连接着的一连串直径为10nm的球状体。,核小体是由H2A、H2B、H3、H4各两个分子生成的八聚体和由大约200bpDNA组成的。八聚体在中间,DNA分子盘绕在外,而H1则在核小体的外面。每个核小体只有一个H1。在核小体中DNA盘绕组蛋白八聚体核心,从而使分子收缩成1/7,200bpDNA的长度约为68nm,却被压缩在10nm的核小体中。但是,人中期染色体中含3.3109碱基对,其理论长度应是180cm,这么长的DNA被包含在46个51m长的圆柱体(染色体)中
13、,其压缩比约为104。,不同式样,精细结构,2染色体中的核酸组成 不重复序列 在单倍体基因组里,这些序列一般只有一个或几个拷贝,它占DNA总量的40%80%。不重复序列长约7502000dp,相当于一个结构基因的长度。单拷贝基因通过基因扩增仍可合成大量的蛋白质,如一个蚕丝心蛋白基因可作为模板合成104个丝心蛋白mRNA,每个mRNA可存活4d,共合成105个丝心蛋白,这样,在几天之内,一个单拷贝丝心蛋白基因就可以合成109个丝心蛋白分子 。中度重复序列 这类重复序列的重复次数在10104之间,占总DNA的10%40%。各种rRNA、tRNA 及组蛋白基因等都属这一类。,非洲爪蟾的18S、5.8
14、S及28SrRNA基因是连在一起的,中间隔着不转录的间隔区,这些单位在DNA链上串联重复约5000次。在卵细胞形成过程中这些基因可进行几千次不同比例的复制,产生2106个拷贝,使rDNA占卵细胞DNA的75%,从而使该细胞能积累1012个核糖体。,高度重复序列卫星DNA 这类DNA只在真核生物中发现,占基因组的10%60%,由6100个碱基组成,在DNA链上串联重复几百万次。由于碱基的组成不同,在CsCl密度梯度离心中易与其他DNA分开,形成含量较大的主峰及高度重复序列小峰,后者又称卫星区带(峰)。,高等真核生物DNA无论从结构还是功能看都极为复杂,以小鼠为例:1.小鼠总DNA的10是小于10
15、bp的高度重复序列,重复数十万到上百万次/genome。 2.总DNA的20是重复数千次、长约数百bp的中等重复序列。 3.总DNA的70是不重复或低重复序列,绝大部分功能基因都位于这类序列中。,着丝粒(Centromere):是细胞有丝分裂期间纺锤体蛋白质与染色体的结合位点(attachment point),这种结合对于染色体对在子细胞中的有序和平均分配至关重要。在酵母中,centromere的功能单位长约130 bp,富含AT 碱基对。在高等真核细胞中,centromere都是由长约510 bp、方向相同的高度重复序列所组成。 酵母端粒(Telomeres)一般以100 bp左右不精确重
16、复序列所组成。,5(TxGy)n3(AxCy)n,其中X、Y一般为14,单细胞真核生物中n常为20100,高等真核生物中1500。,染色体末端的线性重复序列不能被DNA polymarase 所准确复制,它们一般在DNA复制完成以后由telomarase合成后加到染色体末端。,Alu(家族DNA)(长约300bp)是人类高度重复序列,因为该序列中带有Alu的识别序列而得名。 数十万个Alu重复序列散布于整个人类基因组中, 达到总序列的13。 Alu与其它高度重复序列共占人类DNA的10以上。,3染色体中的蛋白质,染色体上的蛋白质包括组蛋白和非组蛋白。组蛋白是染色体的结构蛋白,它与DNA组成核小
17、体。通常可以用2mol/L NaCl或0.25mol/L的HCl/H2SO4处理使组蛋白与DNA分开。组蛋白分为H1、H2A、H2B、H3及H4。这些组蛋白都含有大量的赖氨酸和精氨酸,其中H3、H4富含精氨酸,H1富含赖氨酸;H2A、H2B介于两者之间。,组蛋白的一般特性1.进化上的极端保守性。牛、猪、大鼠的H4氨基 酸序列完全相同。牛的H4序列与豌豆序列相比只有两个氨基酸的差异(豌豆H4中的异亮氨基酸60缬氨酸60,精氨酸77赖氨酸77)。H3的保守性也很大,鲤鱼与小牛胸腺的H3只差一个氨基酸,小牛胸腺与豌豆H3只差4个氨基酸。 2.无组织特异性。到目前为止,仅发现鸟类、鱼类及两栖类红细胞染
18、色体不含H1而带有H5,精细胞染色体的组蛋白是鱼精蛋白。,3.肽链上氨基酸分布的不对称性。碱性氨基酸 集中分布在N端的半条链上。例如,N端的半条链上净电荷为+16,C端只有+3,大部分疏水基团都分布在C端。 4.组蛋白的修饰作用。包括甲基化、乙基化、磷酸化及ADP核糖基化等。 5.富含赖氨酸的组蛋白H5。赖氨酸24%、丙氨酸 16%丝氨酸13%、精氨酸11%。 鸟类、两栖类、鱼类红细胞分离的H5均有种的特异性。,非组蛋白的一般特性 染色体上除了存在大约与DNA等量的组蛋白以外,还存在大量的非组蛋白。非组蛋白的多样性。非组蛋白的量大约是组蛋白的60%70%,但它的种类却很多,约在20-100种之
19、间,其中常见的有15-20种。 非组蛋白的组织专一性和种属专一性。,(3)几类常见的非组蛋a.HMG蛋白(high mobility group protein)。这是一类能用低盐(0.35mol/L NaCl)溶液抽提、能溶于2%的三氯乙酸、相对分子质量较低的非组蛋白,相对分子质量都在3.0104以下。b. DNA结合蛋白。用2mol/L NaCl除去全部组蛋白和70%非组蛋白后,还有一部分蛋白必须用2mol/L NaCl和5mol/L尿素才能与DNA解离。这些蛋白分子量较低,约占非组蛋白的20%,染色质的8%。,七. 原核与真核染色体DNA比较,原核生物中一般只有一条染色体且大都带有单拷贝
20、基因,只有很少数基因如rRNA基因是以多拷贝形式存在; 整个染色体DNA几乎全部由功能基因与调控序列所组成; 几乎每个基因序列都与它所编码的蛋白质序列呈线性对应状态。,真核细胞(Eukaryotic cells) 果蝇带有25倍于E. Coli 的DNA,人类带有600倍于E. Coli 的DNA. Eukaryotic DNA 中基因密度明显低于原核和病毒。如人DNA中平均每毫米只带有50个基因,而E. Coli中基因密度每毫米DNA带有2400个基因!一个人细胞中所带有的DNA约有2m/1.7mm细菌。成人带有1X1014个细胞,成人体内全部DNA的总长度(Contour Length) 2X1011 Km,