1、在基因组水平上探索基因表达的代谢和遗传控制 调控网络的研究方法,蒋舜媛 董霞 程在全2002-12-05,报告提纲,调控网络概述调控网络的分类调控网络的研究方法在基因水平上探索基因表达的代谢和遗传控制,调控网络概述,在生物机体内,所有生命活动过程都受到严格的调节控制,以最有效地方式和途径适应内外环境的变化,以有利生物机体的生存繁衍,这些调节控制可以从不同的层次水平,通过不同的途径和方式,以不同的机制进行调控,而且,不同的调节途径和方式彼此之间可以发生有机的联系,相互作用、相互影响,协调一致,从而构成了复杂的调控网络。,调控网络的分类,可根据不同功能分类:神经调控网络免疫调控网络代谢调控网络激素
2、调控网络细胞内信号传导调控网络基因表达水平的调控网络,调控网络的研究方法,组织及细胞学方法基因突变技术突变体筛选基因工程技术基因缺失基因过表达转基因技术生物芯片技术基因芯片蛋白质芯片,在基因水平上探索基因表达的代谢和遗传控制,Exploring the Metabolic and Genetic Control of Gene Expression on a Genomic Scale Joseph L. DeRisi, Vishwanath R. Iyer, Patrick O. Brown Science Vol. 278. 24 Oct. 1997: 680686,目前, 10多种微生物
3、的基因组全序列已测定。在以后几年中,将有望知道几种多细胞生物的基因组全序列,其中包括人类基因组序列。然而,在这些基因组中,明确每一种基因的功能和作用将是一项十分艰巨的任务,而且从整体水平上了解基因组在生物机体复杂的生命历程中如何发生作用,对于我们将更是一个严峻的挑战。知道一个基因何时何地被表达常常为其生物学作用提供了强有力的线索。相反,在一个细胞中,不同基因的表达模式能够为细胞所处状态提供详细的信息。尽管蛋白质丰度的调节在一个细胞中绝不单独通过mRNA的调控来完成,但实际上细胞类型或状态的所有差异则与许多基因的mRNA水平的改变有关。这是偶然的,因为对特定基因测定其mRNA含量则需要一特效试剂
4、,即是其cDNA序列。DNA微阵列技术(基因芯片),是将数千个单个基因序列高密度排列在一张显微镜载玻片上,这种技术为在大规模的研究基因表达提供了一种实用经济的工具。,酿酒酵母是一种进行基因表达的系统观察研究特别好的研究材料。这些基因在基因组序列中容易识别,顺式调控元件通常紧凑并靠近转录单元,有关它的遗传调控机制已经了解很多,并且一套有力的工具可用于它的分析。,酵母糖代谢的一般特点,酵母自然生长史中的一个重复循环包含了从厌氧(发酵作用)到需氧(呼吸作用)代谢的转换。将酵母接种到富含糖的基质中会引发由发酵提供能量的快速生长,产生乙醇。当可发酵的糖用尽时,酵母细胞转向将乙醇作为碳源供有氧生长。 这个
5、基于葡萄糖损耗的从厌氧生长到需氧呼吸的转换,即指如双峰转换(Diauxic shift).该转换与涉及到细胞基本代谢过程中的基因表达中普遍改变有关,这些代谢包括碳代谢、蛋白质合成,和碳水化合物储存等。,Fig. 3. Metabolic reprogramming inferred from global analysis of changes in gene expression.,酵母中的代谢途径糖酵解有氧呼吸TCA循环乙醛酸循环糖异生,我们使用DNA微阵列来刻画整个基因组的基因表达过程的变化,并研究调控和执行该过程的遗传途径,基因芯片技术研究糖代谢中基因表达调控的一般过程,DNA微阵列制
6、备6400个DNA序列,提取制备RNA探针,制备荧光标记cDNA,杂交,酵母细胞,反转录,指数生长的细胞的不同培养阶段,图解说明,DNA微阵列制备:利用购买的一组引物对, 将酵母的开放阅读框部分通过PCR放大.,包含大约6400个清楚的DNA序列,被用一个简单的自动机械印刷装置印刻在玻璃载片上, 构成相应的DNA微阵列。mRNA探针制备:将来自以指数生长培养的酵母细胞接种到新鲜的基质中在30C生长21小时。在开始生长9小时后,然后依次获得经历间隔2小时7个不同阶段连续培养的样品,并分离制备mRNA 。cDNA制备:通过Cy3(绿色)或 Cy5(红色)-标记的dUTP经反转录制备荧光标记的cDN
7、A,杂交: cDNA与微阵列杂交。观察、分析,图解说明,为使识别基因表达水平变化的可靠性最大化,我们标记了从每个连续间隔时间点培养的细胞中获得的cDNA, 用Cy5标记,然后将其与Cy3-标记的对照cDNA样品混合 ,后者来自于从接种后的第一个间隔时间得到的细胞。在这个实验设计中,测量每一个排列单元Cy3和Cy5荧光物质的相对荧光强度,可以提供为两个细胞群体中对应mRNA的相对丰度的一个可靠量度(Fig. 1)。来自7个样品的系列数据(见Fig. 2), 由超过43000表达率量度单位组成,被组织成一个数据库, 以推动对实验结果的进一步探索和的高效分析。该数据库可在网上公开获得。,Fig. 1
8、. Yeast genome microarray,在这个实验设计中,测量每一个排列单元Cy3和Cy5荧光物质的相对荧光强度,可以提供为两个细胞群体中对应mRNA的相对丰度的一个可靠量度,Fig. 2. The section of the array indicated by the gray box in Fig. 1,在一个细胞中,不同基因的表达模式能够为细胞所处状态提供详细的信息。尽管蛋白质丰度的调节在一个细胞中绝不单独通过mRNA的调控来完成,但实际上细胞类型或状态的所有差异则与许多基因的mRNA水平的改变有关。,hybridization of the Cy3-dUTP-label
9、ed cDNAhybridization of Cy5-dUTP-labeled cDNAGenes expressed at roughly equal levels before and after the diauxic shift,Fig 1. Yeast genome microarray,TDH1催化PEPGA-3-P,PDC1催化丙酮酸乙醛,ALD2乙醛酸脱氢酶,Fig. 1 图解说明,荧光标记cDNA探针是来自于从接种后不久的细胞中分离得到的mRNA(培养密度5106 cells/ml,基质葡萄糖水平为19g/liter), 在Cy3-dUTP存在下的通过反转录制备。类似的,另
10、一个探针来自培养9.5小时后分离的同一细胞群中的mRNA(培养密度2108 cells/ml,基质葡萄糖水平为0.2 g/liter), 在Cy5-dUTP存在下通过反转录制备。在这幅图中,Cy3-dUTP-labeled cDNA的杂交(即,mRNA在初始时间点的表达)显示为绿色信号,Cy5-dUTP-labeled cDNA的杂交(即,mRNA在9.5小时的表达)显示为红色信号。这样,双峰转换后被诱导或抑制的基因在本图中就分别显示为红色和绿色的斑点。双峰转换前后表达水平大致相等的基因在本图中显示为黄色斑点。,在用于分析双峰转换期间基因表达的每个微阵列中红点代表被诱导的与初始时刻有关的基因,
11、绿点代表被抑制的与初始时刻相关的基因。在用于分析tup1突变和YAP1 过表达影响的阵列中红点代表表达增加的基因,绿点代表经遗传修饰导致表达降低的基因。注意区分明显的基因组是在不同的实验中被诱导和抑制的。在600nm的光密度下测量的细胞密度是用于测量培养物的生长情况。,Fig. 2. Fig. 1中灰色方框标记的部分阵列所显示所描述的每组实验,Fig. 2. 图解说明,酵母在Glu培养基上进行指数生长的过程中, 其基因表达的整体情况是相当稳定的。在比较最初两个细胞样品的基因表达情况时(间隔2小时收获),19个基因(0.3%)的mRNA水平差异2 倍或2倍多,最大的差异也仅有2.7倍。,Fig.
12、 2. 图解说明,然而,当培养基中的Glu被逐渐消耗时,基因表达的整体情况可发生明显的变化。大约710个基因的mRNA水平被诱导至少增加了2倍; 大约1030个基因的mRNA水平下降了至少2倍; 183个基因的mRNA水平至少增加了4倍; 203个基因的mRNA水平至少减少了4倍。,目前,这些表达不同的基因中大约有一半其功能还没有被认识,而且也没有命名。相对于那些功能已知的基因而言, 400多个表达不同的基因没有明显同源性. 因此,这些以前尚未被认识的基因对双峰转换的应答,首次为了解它们的作用提供了有益的线索。,红框白字确定了在双峰转换中表达增加的基因。绿框深绿字确定了在双峰转换中表达降低的基
13、因。黑白框表示无显著差异表达(小于2倍)。连接可逆酶促反应步骤的箭头方向,表示从基因表达情况中推断出的双峰转换后中间代谢物代谢方向。基因被强烈诱导表达的酶催化的反应步骤,用突出的红色箭头表示。宽灰色的箭头表示从基因表达情况中推断出的双峰转换后代谢物主要增加的流向。,Figure 3. Metabolic reprogramming inferred from global analysis of changes in gene expression.,Fig. 3. 从基因表达改变的全局分析中推断得到的糖代谢调整图谱。,图中只确定了关键的中间代谢产物。编码代谢通路中催化每一步反应的酶的酵母基因
14、名字在方框中给出。编码琥珀酰CoA合成酶和肝糖脱支酶的基因尚未明确鉴别(给出),但ORFs YGR244 和 YPR184分别表现出与琥珀酰CoA合成酶和肝糖脱支酶显著的同源性,因此被标注在该图的相应步骤中。红框白字确定了在双峰转换中表达增加的基因。绿框深绿字确定了在双峰转换中表达降低的基因。这些基因的诱导和抑制程度在图中也显示出来。对多亚基酶复合体,如琥珀酸盐脱氢酶,标注的诱导倍数代表框中所列的所有基因的一个无关紧要的平均数。黑白框表示无显著差异表达(小于2倍)。连接可逆酶促反应步骤的箭头方向,表示从基因表达情况中推断出的双峰转换后中间代谢物代谢方向。基因被强烈诱导表达的酶催化的反应步骤,用
15、突出的红色箭头表示。宽灰色的箭头表示从基因表达情况中推断出的双峰转换后代谢物主要增加的流向。,Fig. 3 图解说明,那些功能已知的基因在表达过程中所表现出的各种变化,这些变化为我们展现了一幅细胞通过何种方式有效适应环境变化的鲜明生动的图画。图3显示了与糖代谢和能量代谢有关的酵母代谢途径。我们将观察到的mRNA编码的每一个酶的变化,通过图解标注在一个代谢通路的框架上,从而使我们能据此推断代谢体系中代谢物的代谢去路。,Fig. 3 图解说明,实验中,我们观察到醛脱氢酶(ALD2)和乙酰辅酶A合成酶(ACS1)被大量诱导合成,这两种酶的作用就是一起将乙醇脱氢酶的产物,即乙醛,转化为乙酰辅酶A,而乙
16、酰辅酶A则进一步参与三羧酸循环(TCA)和乙醛酸循环(支路),为其提供能量原料。随着编码丙酮酸脱羧酶的基因转录停止和丙酮酸羧化酶的诱导合成,从而使丙酮酸代谢转向合成草酰乙酸,而不再生成乙醛,为TCA循环和糖异生提供原料。由于编码磷酸烯醇丙酮酸羰激酶基因PCK1和编码1,6-二磷酸果糖的基因FBP1两个关键基因被诱导转录,逆转了糖代谢过程中的两个不可逆反应的代谢方向,从而使代谢沿着糖酵解途径的可逆反应逆向朝着合成-磷酸葡萄糖(6-P-G)方向进行。诱导编码海藻糖合成酶和糖原合成酶复合体的基因转录,可进一步促进6-P-G转化合成海藻糖和糖原进入糖储存途径。,Figure 4. Coordinate
17、d regulation of functionally related genes.,曲线代表在每个指定组中所有基因的平均诱导和抑制率。,几类基因,如细胞色素C相关基因,和那些参与TCA/乙醛酸循环和糖储藏反应途径的相关基因,在葡萄糖消耗时它们同等地被诱导表达。相反,蛋白质合成的有关基因,包括核糖体蛋白,tRNA合成酶,和翻译、延长及初始因子的基因等,则表现出同等程度地表达降低。,Fig. 4. 功能性相关基因的协同调控,各群组中基因的总数如下:核糖体蛋白,112;转录延长和起始因子,25;tRNA合成酶(不包括线粒体合成酶), 17;肝糖原和海藻糖合成和降解,15;细胞色素C氧化酶和还原酶
18、蛋白,19;TCA和乙醛酸循环酶,24。,正如编码关键酶的基因表达的改变能增强对代谢程途径调整调认识一样,大批量功能相关基因的表达行为分析,可以为研究酵母细胞适应多变环境的系统方法提供宽广视野。几类基因,如细胞色素C相关基因,和那些参与TCA/乙醛酸循环和糖储藏反应途径的相关基因,在葡萄糖消耗时它们同等地被诱导表达。相反,蛋白质合成的有关基因,包括核糖体蛋白,tRNA合成酶,和翻译、延长及初始因子的基因等,则表现出同等程度地表达降低。在双峰转换过程中,超过95%的核糖体基因的表达至少降低2倍(Fig. 4)。一个值得注意且有启发性的例外是编码线粒体核糖体的基因在葡萄糖限制后通常是被诱导,而不是
19、被抑制,这对线粒体的生物发生是十分必要的。当从酵母基因组中了解到更多关于每个基因的功能时,通过其全体基因表达模式获得深入了解细胞适应环境变化的能力将变得愈加强大。,Fig. 4. 图解说明,Figure 5. Distinct temporal patterns of induction or repression help to group genes that share regulatory properties.,细胞密度的时序分布图只在最后的时间点(20.5小时)表现出强诱导(大于9倍)的 7个基因7个在18.5小时时间点早期诱导时mRNA水平上有一个峰。细胞色素C氧化酶和泛醌细胞色
20、素C还原酶基因。有一个与双峰转换一致的诱导标记双峰转换前被抑制,并持续抑制进入稳定阶段的基因核糖体蛋白基因包含一大类被抑制在葡萄糖降解(阶段)的基因。,Fig. 5. 诱导和抑制的不同时序模式有助于将基因根据它们共同调控特性分为相应的组:,细胞密度的时序分布图,在600nm OD测定和基质中葡萄糖浓度。7个基因表现强诱导(大于9倍)只在最后的时间点(20.5小时)。除IDP2外,这些基因的每一个都有一个CSRE UAS。没有发现适合这张分布图的额外基因。被标记的一类基因中有7个在18.5小时时间点早期诱导时mRNA水平上有一个峰。这些基因中在上游启动子区域都含有STRE重复基序。细胞色素C氧化
21、酶和泛醌细胞色素C还原酶基因。被一个与双峰转换一致的诱导标记,这些基因都含有一个HAP2,3,4 蛋白复合体识别的共有结合基序。至少17个基因具有相似的表达分布图。SAM1, GPP1,和几个未知功能的基因在双峰转换前被抑制,并持续抑制进入稳定阶段。核糖体蛋白基因包含一大类被抑制在葡萄糖降解(阶段)的基因。这些基因在其启动子上游都包含一个和多个的RAP1结合基序。RAP1是大多数核糖体蛋白中的一个转录调控子。,Fig. 5,具有相同表达分布图的来自额外群组的基因的例子在Fig. 5, C到F中显示。在Fig. 5C中,已命名基因的上游序列都具有应激反应元件(STRE),但HSP42例外,以前研
22、究表明它们至少部分受这些调控元 件(21-24)。Fig. 5C中显示的对HSP42 和两个未描述特征的基因 (YKL026c,一个与谷胱甘肽过氧化酶有相似性的假想蛋白;YGR043c ,一个假定的二羟丙酮基转移酶) 的上游序列进行的研究 ,揭示这些基因中也都有应激反应基序CCCCT的上游重复序列。在这张表达分布图上的酵母基因组中的13个额外基因中(包括HSP30, ALD2, OM45, 和10个未表明特征的开放阅读框(ORFs)(基因 ) (25)),有9个在其上游区域含有一个和多个可识别的STRE位点,Fig. 5,异源三聚体的转录活化因子复合体HAP2,3,4已显示对呼吸过程中几个至关
23、重要基因的诱导发挥作用(26-28)。该复合体结合一个简并性的共有序列,已知为CCAAT盒子 (26)。利用共有序列TNRYTGGB进行计算机分析,已提示参与呼吸作用的大量基因可能为HAP2,3,4的特定靶点(30)。确实,在7个细胞色素c相关基因的每一个基因的上游序列中,均能发现一个假定的HAP2,3,4结合位点,这7 个基因显示出最大程度的诱导表达(Fig. 5D)。在12个被诱导表达的额外细胞色素C相关基因中,除一个例外,其余11个均有 HAP2,3,4结合位点。值得注意的是,我们发现,随着双峰转换,HAP4本身转录诱导差不多达9倍。,Fig. 5,核糖体蛋白生物合成的调控主要在转录水平
24、,通过存在的一个相同的的上游激活元件进行,该元件可被Rap1DNA结合蛋白识别(31, 32)。Fig. 5F显示了7个核糖体蛋白的表达分布图,对7个基因上游序列的分析显示均存在共有Rap1结合基序(33)。这提示,在饥饿状态下,细胞内Rap1水平降低可能是造成核糖体蛋白表达的下降的原因(34)。确实,我们观察到在葡萄糖耗尽时, RAP1 mRNA丰度减少了4.4倍。 在149个编码已知或假定的转录因子的基因中,只有HAP4和SIP42个基因在双峰转换时被子诱导增加3倍。SIP4编码一个DNA结合转录活化因子,该因子可与葡萄糖抑制的主要调控因子Snf1相合(35)。 在葡萄糖降解时SIP4诱导
25、增强8倍有力地提示,在双峰转换中SIP4可能对诱导下游基因表达发挥重要作用。,结 语,使用DNA微阵列来描述受调控分子的活动影响的突变的转录结果,为分析和了解调控途径和网络提供了一个简单而有力的技术方法。这种策略同样在药物筛选中也具有重要的应用价值。在编码候选药物靶蛋白的特定基因中,基因突变可以作为基因表迖理想的化学抑制剂或调节因子的代用品。DNA微阵列可被确定基因表达导致的信号模式变化,然后分析来筛选能够产生理想信号模式的化合物。,结语,在基因组水平上探索基因表达模式,DNA微阵列为此提供了一个简单而经济的技术方法。将这一方法扩展应用到任何其他组织均没有多大的障碍。生产和使用DNA微阵列所需的设备可选择价格适中和简单的组件。对一个研究小组来说,只要得到基因序列,在4个月内完成6000多个基因的扩增是可行的,而且只需2天就可印制一套110型微阵列,每个微阵列有6400个单元。,结语,探针的制备、杂交,以及荧光显像也都是很简单的操作过程。甚至概念上简单的实验,象我们这里所描述的一样,均可以产生大量的信息。如同每个基因的功能被了解得更多,别的实验方法同样可以确定众多其他自然过程和遗传影响中基因表达的全局改变一样,每个这种实验所提供信息价值也将不断增加。也许目前最大的挑战是发展有效的方法,以利于从实验提供的大量数据中组织、分配、解释和提炼观点、见解。,致谢,