1、碱基序列标记法结合焦磷酸测序测定不同来源基因表达量作者:张晓丹 武海萍 陈之遥 周国华【摘要】 建立了一种将序列标记反转录聚合酶链反应(PCR)与焦磷酸测序技术结合的相对基因表达量测定法(简称“SRPP”)。先用来源特异性引物对不同来源的同一基因通过反转录标记上特异性标签,PCR 后用焦磷酸测序法对扩增产物进行序列解码,使得测序结果中的序列代表基因的来源,峰高代表基因在不同来源中的相对表达量。用实时荧光定量 PCR法对本方法的准确性进行了验证,结果表明,SRPP 可以同时准确测定同一基因在 3 个不同来源中的表达量,并实际测定了 Egr1 基因在糖尿病、肥胖和正常小鼠肝中的表达量差异。 【关键
2、词】 序列标记反转录, 聚合物链反应,焦磷酸测序,基因表达1 引 言差异表达基因与疾病密切相关,深入研究可在基因水平揭示疾病的发病机制。目前,用于检测基因表达水平的技术主要有 SAGE 法1、实时荧光定量 PCR 法2,3和基因芯片法4等。但这些方法存在仪器设备昂贵、定量性能差以及同时测定基因表达量的来源数目受限等缺点。焦磷酸测序技术是新近发展起来的一种基于酶催化化学反应的测序技术58,不需要使用荧光标记,定量性能好。目前,焦磷酸测序技术多用于单核苷酸多态性(SNP)分析、微生物分型和基因甲基化分析等。本研究将焦磷酸测序技术用于基因表达量差异的比较分析,考察了其可行性和准确性,并将其应用于检测
3、 Egr1 基因在糖尿病、肥胖症和正常小鼠中的差异表达。2 实验部分2.1 仪器、试剂与材料21R 型台式高速冷冻离心机(美国 Beckman 公司);Gene Spe微量核酸蛋白测定仪(日本 Naka Instrument 公司);PTC225 PCR 扩增仪、Opticon 实时荧光 PCR 仪(美国 MJ Research 公司)。焦磷酸测序装置由本实验室自行组装9,10。此装置主要由焦磷酸测序反应模块、荧光信号放大和数据采集 3 部分组成。反应模块由位于中间的反应池通过毛细管与四周的 dNTP 储液池相连组成。通过注射器施压使 4 种 dNTP 循环加入反应池完成测序反应。荧光信号通过
4、 R6335 光电倍增管(日本 Hamamatsu Photonics K.K.公司)放大后,经 BPCL 微弱发光测量仪(北京中国科学院生物物理研究所)采集数据。Hotstar Taq DNA 聚合酶、Omniscript RT kit 反转录试剂盒(德国 Qiagen 公司);Trizol(上海 Inviotrogen 公司);荧光素、荧光素酶、三磷酸腺苷硫酸化酶、三磷酸腺苷双磷酸酶和 5 磷酸化硫酸腺苷(美国 Sigma 公司); DynabeadsM280 链霉亲和素磁珠(挪威 Dynal AS 公司); Klenow DNA 聚合酶(美国 Promega 公司);所有引物均由上海In
5、vitrogen 公司合成。实验中用到的糖尿病、肥胖和正常小鼠的肝组织由南京师范大学生命科学学院提供。2.2 RNA 的提取用 Trizol 试剂盒抽提 RNA,用紫外分光光度法测定 RNA 浓度及纯度。2.3 反转录合成 cDNA 第一链取等量的不同来源的总 RNA,分别以来源特异性反转录引物反转录。即取总 RNA 0.052.0 g 至 Nucleasefree 的小管中,加 DEPCH2O至 12 L;65 反应 5 min 后,置冰上至少 1 min;在上述各小管中加入10第一链合成缓冲液 2 L,0.5 mmol/L dNTP 混合物,10 U RNase 抑制剂,200 U Omn
6、iscript Reverse Transcriptase,1 mol/L 反转录引物,加 DEPCH2O 至总体积为 20 L。反转录条件为:37 反应 1 h, 93 反应 5 min,然后中止反应。2.4 基因特异性 PCR不同来源的 cDNA 等比例混合,以共用引物 CP(5CCA TCT GTT CCC TCC CTG TC3) 和生物素标记的基因特异性引物(GSP)进行扩增反应。PCR 体系为: cDNA 等比例混合液 1 L , 0.3 mol/L CP 和GSP,1.5 mmol/L Mg2+, 0.2 mmol/L dNTP 混合物,10PCR 缓冲液 5 L,5Q 溶液 1
7、0 L , 1 U HotStar Taq DNA 聚合酶,并加入灭菌蒸馏水至 50 L。PCR 反应程序为: 94 变性 15 min,热循环 35 次(94 , 40 s; 60 , 40 s; 72 , 1 min ), 72 延伸 10 min, 4 保存。基因特异性引物的序列见表 1。表 1 实验用引物2.5 焦磷酸测序固相单链模板的制备取 5 L 戴诺磁珠(Dynabeads),用磁铁吸弃上清液。磁珠以 100 L BW Buffer(10 mmol/L TrisHCl, pH 7.5, 1 mmol/L EDTA, 2.0 mol/L NaCl)洗涤两遍,最终悬浮于 50 L B
8、W 缓冲液中;加入50 L PCR 产物,37 反应 30 min;用磁铁吸弃上清液,磁珠以 180 L H2O 洗涤两遍,加入 0.1 mol/L NaOH 溶液 20 L,混匀室温放置 5 min 使 PCR 产物变性;磁铁吸弃上清液,磁珠以 100 L BW 缓冲液洗涤两遍,100 L 1退火缓冲液洗一遍,最终溶于 8 L 1退火缓冲液中;加入 1 L 10 mol/L 测序引物,93 混匀 30 s,55 退火3 min,4 保存,待测序用。2.6 焦磷酸测序反应焦磷酸测序标准混合液的组成为:0.1 mol/L TrisAc 缓冲液(pH 7.7),2 mmol/L EDTA,10 m
9、mol/L Mg(Ac)2,0.1% BSA,1 mmol/L 二硫苏糖醇(DTT),3 mol/L 5 磷酸化硫酸腺苷(adenosine5phosphosulfate ,APS),0.4 g/L PVP,0.4 mmol/L D 虫荧光素, 210-4 U/L 三磷酸腺苷硫酸化酶, 210-3 U/L 三磷酸腺苷双磷酸酶,1810-3 U/L 无外切酶活性的 Klenow DNA 聚合酶,14.6 mg/L 荧光素酶。3 结果与讨论3.1 方法原理焦测序技术是一种基于化学发光反应定量测定引物延伸副产物焦磷酸盐(PPi)的测序技术。其原理是:引物与模板 DNA 退火后, 在 DNA 聚合酶(
10、polymerase)、三磷酸腺苷硫酸化酶(ATP sulfurylase)、荧光素酶(luciferase) 和三磷酸腺苷双磷酸酶(apyrase)的协同作用下完成循环测序反应。当加入的 dNTP 与模板互补时,DNA 模板与互补的 dNTP 聚合可以产生等摩尔 PPi;在三磷酸腺苷硫酸化酶的催化下,PPi 与 5 磷酸化硫酸腺苷(APS)反应生成等量的 ATP;在荧光素酶催化作用下,ATP 与虫荧光素(luciferin)反应发出荧光。产生的荧光信号强度与聚合的测序模板量和碱基数成正比,根据加入的 dNTP 类型和测得的荧光信号强度就可实时记录模板 DNA 的核苷酸序列。反应方程式如下:(
11、DNA)n+dNTPpolymerase(DNA)n+l+PPi(1)PPi+APSATP sulfurylaseATP+SO2-4(2)ATP+Luciferin+O2luciferaseAMP+PPi+Oxyluciferin+CO2+hv(3)dNTPApyrasedNDP+PiApyrasedNMP+Pi(4)ATPApyraseADP+PiApyraseAMP+Pi(5)为了定量测定基因表达量差异,本研究将碱基序列标记法与焦磷酸测序解码技术相结合,其关键点在于:在不同来源的同一基因中标记上区别样品来源的特异性标签;对标记序列进行解码和定量测定。采用反转录引物将来源特异性碱基标记到各来
12、源待测基因,然后用焦磷酸测序定量测定标记序列。具体测定过程如图 1 所示:(1) 用来源特异性反转录引物对不同来源的 RNA 进行反转录。引物由 4 部分组成:5端为共用序列;位于引物中间的 4 个碱基为人为设计的来源特异性标签,在图 1 中以深浅不同的 4 个小圆点表示;3端为 oligo(dT)n 和用于固定 oligo(dT)n 位置的两个兼并碱基。来源特异性反转录引物的碱基组成和数目都相同,只是位于中间的来源特异性碱基的排列位置有所差异;(2) 不同来源的 cDNA稀释后等比例混合;(3) 用生物素标记的基因特异性引物和共用引物扩增上述混合物,通过改变基因特异性引物就可以进行任何基因的
13、表达量差异分析;(4) 用磁性微球技术将 PCR 产物制备成单链,根据来源特异性反转录引物中来源标签序列进行焦磷酸测序。测序结果中,各来源特异性碱基的相对峰高即代表相对基因表达量差异。本方法称之为 SRPP 法(Sequencetagged reversetranscription PCR with pyrosequencing)。图 1 碱基序列标记法结合焦磷酸测序解码技术测定基因表达量差异的原理图Fig.1 Principle of comparative gene expression analysis by coupling sequencetagged reversetranscri
14、ption polymerase chain reaction(PCR) with pyrosequencing (SRPP)由于不同来源的同一基因在单管中只用一对引物进行 PCR,并且扩增产物的碱基组成和含量完全一样,仅 4 个碱基的排列顺序不一样,具有相同的保留时间。所以来源不同,表达量不同的同一基因在单管中能实现等比例扩增。SRPP 测定峰高比值也即能代表起始基因的相对表达量。3.2 焦磷酸测序的定量特性在同一焦磷酸测序反应体系中,产生的荧光信号强度与 ATP 的量成正比,而 ATP 的量与聚合的 dNTP 个数成正比,所以可以根据图谱中测得的信号强度推测出模板 DNA 相对含量。为了验
15、证焦磷酸测序的定量特性,人为设计了一条测序单链(5GG TT CC AA G T C A CCCCGCCCGC3 )和一条测序引物(5GCGGGCGGGG3) ,使测序单链的 3端与测序引物单链的 5端完全互补。两条单链退火后按dTTPdGTPdATPSdCTP 的顺序循环递加 dNTP 进行测序反应。结果显示,待测模板上测序引物的延伸序列为“T G A C TT GG AA CC”12 个碱基,其信号强度跟同质区的相同碱基个数成正比。这一结果表明,峰强度与被引物延伸模板的量成正比,可通过测定各峰的峰高之比确定对应的模板的相对含量。本研究利用焦磷酸测序技术的定量特性,通过测序图谱中的峰高比值分
16、析不同来源的基因相对表达量。3.3 来源特异性基因的标记及标记模板的等比例扩增SRPP 法定量的关键在于能否在单管中等比例扩增经标记的不同来源的同一基因。为了验证 SRPP 法是否具有此特性,人工模拟了一系列Actb 基因的 3 个不同来源(分别命名为“来源 G”, “来源 T”和“来源C”)进行测定。具体方法为取同一来源的 RNA 样品分成 3 等份,分别用来源特异性反转录引物 RTG(5CCA TCT GTT CCC TCC CTG TC gatc ttt ttt ttt ttt ttt VN3), RTT(5CCA TCT GTT CCC TCC CTG TC tacg ttt ttt
17、ttt ttt ttt VN3) 和 RTC (5CCA TCT GTT CCC TCC CTG TC catg ttt ttt ttt ttt ttt VN3) 进行反转录反应,使反转录产物分别被标记上“来源 G”、 “来源 T”和“来源 C”的特异性标签(上述序列中的带下划线的斜体部分)。然后将上述经标记的cDNA 模板,分别以 111, 511, 151 和 115(来源 G来源 T来源 C)的体积比混合,作为系列人工模拟模板分别进行 PCR 扩增,测定结果如图 2 所示,序列中的第一个碱基“G”代表“来源 G” 的模板;第二个碱基“T”代表“来源 T”的模板;第三个碱基“C”代表“来源
18、 C” 的模板。3 个碱基信号峰的相对强度代表着 Actb 基因在 3 个不同来源中的相对表达量。通过计算峰高的比值即可得到所测基因在不同来源中的表达差异。由于 dNTP 不稳定,存在少量的分解产物 PPi,在焦磷酸测序中可能会出现背景峰,影响结果的准确性。为此,焦磷酸测序中每种 dNTP 都连续加入两次,所以图 2 中每次焦磷酸测序都出现 6 个峰。其中第 1 次得到的峰为信号峰,第 2 次为 dNTP 背景峰,计算结果时要在信号强度中扣除背景。3 种来源模板等量混合(111)的测序结果如图 2A 所示,测得的峰高比为 1.11.01.0 (来源 G来源 T来源 C),此测定值与模板理论比例
19、 111 十分相近;如图 2(BD)所示, 图 2 Actb 基因在不同人工模拟 3 种来源中的表达量差异测序图谱,3 种来源的理论表达量比为 111(A), 511(B), 151(C)和 115(D)(每种 dNTP 都连续加入两次以扣除其背景吸收)Fig.2 Pyrograms of simulated templates prepared by pooling three sourcespecific cDNAs at the ratios of 111 (A), 511 (B), 151 (C), and 115 (D), respectively. PCR was performe
20、d by using the common primer and the Actb genespecific primer. Each deoxyribonucleoside triphosphate(dNTP) was dispensed twice for detecting the background due to pyrophosphoric acid(PPi) impurity in dNTP solution 模板比例为 511, 151 和 115 的 SRPP 测定结果分别为:5.11.01,0.974.81 和 0.20.21。结果表明,不同比例的各标记模板(各模板的差别仅
21、是 4 个碱基的排列序列不同)得到了等比例扩增,没有序列歧视性,即通过测定扩增产物的比例就可以间接得到不同来源中基因的表达量差异。3.4 准确性实验为进一步验证本方法的准确性,将本方法的测定结果与实时荧光定量 PCR 法进行比较。采用本方法平行测定 2 次,Actb 基因在小鼠肾、心和脑中的相对表达量之比分别为 38.819.841.3 和40.019.540.5。平均值为 39.419.640.9。同时采用实时荧光定量 PCR 测得 Actb 基因在肾、心和脑中的相对表达量比值为37.822.040.2。与两种方法测定结果一致, 说明 SRPP 可以用于准确测定同一基因在不同来源中的表达量差
22、异。3.5 Egr1 基因在糖尿病小鼠、肥胖小鼠和正常小鼠肝中的表达量差异的测定最近研究表明,胰岛素是一种抗炎激素,抑制几种促炎转录因子如 Egr1 的基因表述11。因此产生胰岛素抗性或者胰岛素作用不正常的糖尿病人,体内促炎转录因子被激活,相应基因的表达量增加。另外肥胖是人体的一个炎症状态12,炎症参与胰岛素信号传导的干预,产生胰岛素抗性,也会激活这些促炎转录因子,增加相应基因的表达。本实验将 SRPP 法应用于模型小鼠 Egr1 基因表达量差异的研究。研究了 3 组(a, b, c)共 9 只小鼠,每组中分别有糖尿病、肥胖和正常小鼠各 1 只。提取上述小鼠的肝组织的 RNA,取等量的 RNA
23、 反转录,反转录引物为 RTG, RTC 和 RTT ,使其产物被人为地标记为“糖尿病 G”、“肥胖 T”和“正常 C”。再将反转录产物等比例混合,以公用引物 CP 和基因特异性引物 bioEgr1GSP 进行 PCR 扩增,焦磷酸测序。为了去除不同来源 RNA 产量、质量以及逆转录效率上可能存在的差别,选择看家基因 Actb 作为内参基因进行校正。3 组小鼠均按上述方法进行 SRPP 测定。结果如图 3 所示(典型焦磷酸测序图谱)。以归一化法计算 Egr1 和 Actb基因在糖尿病、肥胖和正常小鼠肝中的表达量,3 组小鼠肝中 Egr1 基因经看家基因 Actb 校正后的相对表达量分别为:2.
24、410.341.22, 0.780.492.18 和 0.540.901.56。同时采用实时荧光定量 PCR对 Egr1 和 Actb 基因在上述小鼠肝中的拷贝数进行了定量测定,按相同方法进行数据处理,测得的经 Actb 校正后的 Egr1 基因相对表达量分别为 2.500.391.08, 0.810.472.46 和 0.560.871.69。结果见表 2。此例说明 SRPP 方法可以有效地用于研究不同来源的基因表达量。表 2 SRPP 和实时荧光 PCR 测定结果【参考文献】1 Velculescu V E, Zhang L, Vogelstein B, Kinzler K W. Scie
25、nce, 1995, 270(20): 4844872 Karet F E, CharnockJones D S, HarrisonWoolrych M L, OReilly G, Davenport A P, Smith S K. Anal. Biochem., 1994, 220(2): 3843903 Ginzinger D G. Exp. Hematol., 2002, 30(6): 5035124 Schena M, Shalon D, Davis R W, Brown P O. Science, 1995, 270(5235): 4674705 Ronaghi M. Genome Res., 2001, 11(1): 311