1、非编码RNA研究方法及应用,中国医科大学科学实验中心 刘 洁,一. RNA组学(RNomics),RNA研究历史,第一阶段:十九世纪八十年代至二十世纪初,解决了核酸组成和核苷酸结构。第二阶段:本世纪五、六十年代,发现转运RNA(transferribonucleicacid,tRNA) 核糖体RNA(ribosomal RNA, rRNA)、信使RNA(messenger RNA,mRNA), 破译遗传密码,基本明确RNA将遗传信息从 DNA传递至蛋白质的途径。第三阶段:本世纪八十年代开始,重新认识RNA传递遗传信息功能,全面认识 RNA生物功能多样性。,RNA研究获得的诺贝尔奖,RNA领域的
2、新发现,1. RNA控制着蛋白质的生物合成。生物体内绝大多数生化反应由酶(蛋白质)催化控制。多年来,人们努力寻找催化蛋白质生物合成的关键酶(转肽酶)。 2000年,通过X线衍射分析核糖体大,小亚基的晶体,发现在肽键形成的2纳米范围中,没有蛋白质电子云存在。表明肽键的形成由核糖体RNA(rRNA)催化。核糖体是核酶,这成了2000年世界第二大科学成就。,噬菌体29装配过程中,有一种能够协助病毒进行自我装配的核酸大分子,它是一类RNA分子,由六个相同的RNA分子构成的六元环。首先由外壳蛋白组装成噬菌体外壳,然后由包装RNA(packagin RNA,pRNA),在噬菌体基部的门上装配成分子马达,依
3、赖次马达的转动,将噬菌体DNA装入病毒外壳。这种分子发动机可产生巨大的推力,是以ATP供能物质作为开关的。,2. RNA具运动功能,pRNA,3. RNA具调控功能,女性Xist RNA结合在X染色体上(见箭头),关闭整个X染色体基因的表达,染色体DNA3末端在端粒酶的作用下,以端粒RNA为模板,合成端粒DNA。细胞分裂时,DNA每复制一次,端粒DNA缩短些,直至端粒全部消失,细胞再不分裂,导致死亡。成人正常细胞没有端粒酶和端粒RNA,癌细胞有。端粒RNA,控制细胞寿命和癌症发生。,4. RNA调控遗传信息,通过不同方式的RNA剪接,一种基因可在不同的发育、分化阶段,不同的生理病理条件下或不同
4、的细胞、组织中合成不同的蛋白质。很多生物mRNA的成熟过程,均需经RNA编辑。在蛋白质生物合成过程中,有多种称为“再编辑”的方式。通常mRNA编码区每三个核苷酸组成一个密码子,编码区每个核苷酸只能也必须被阅读一次。再编码过程中,有的核苷酸被跳过没被阅读,有的却被阅读两次,有的被用来翻译特殊氨基酸。,5. RNA修饰,RNA由4种核苷酸组成,但通过核苷酸修饰增加了RNA结构的复杂性,为RNA功能多样性提供了物质基础。rRNA中核苷酸的甲基化修饰和假脲嘧啶的生物合成、以及加工和细胞定位转运,均有一类小分子rRNA参与。,6. RNA携带遗传信息,在一些病毒中,不是DNA,而是RNA携带遗传信息。通
5、常核酸是单链的(ssRNA single-stranded RNA),也有双链的(dsRNA double-stranded RNA)。RNA病毒有:艾滋病病毒、烟草花叶病毒、SARS 病毒、MERS病毒、埃博拉病毒(EBOV)、西班牙流感病毒、甲型H1N1流感病毒、禽流感病毒、噬菌体(有一部分噬菌体是DNA病毒,如T2噬菌体)等。植物病毒,除少数例外,大多数是RNA病毒。,7. RNA与疾病的关系,RNA突变或异常可引起疾病,如红斑狼疮、重症肌无力、某些II型糖尿病、某些帕金森病、某些老年痴呆等。一些RNA突变后,造成蛋白质合成障碍或蛋白质合成错误率增加。一种RNA突变,常可因其发生的部位不
6、同,影响到不同蛋白质,而引起不同的疾病。不同RNA的突变又可能因发生在同一种细胞或组织中,而引起同一种疾病。也可因引起一系列蛋白质合成的错误,表现为综合征。,8. 基因组研究中的“垃圾”可能是RNA基因,基因组研究过程中,发现大量不编码蛋白质的重复序列,一度被称为“垃圾”,该物质越是在高等生物中含量越多。Alu家族的序列被认为是反式可移动元件,调控临近基因的表达。,研究所有上述各种RNA的时空表达情况及其生物学意义,将在全面破解生命奥秘中发挥重要作用。中外科学家都注意到了以此为研究对象的RNA组学问题。我国科学家在1998年第109次香山科学会议,2000年1月第11次东方科技论坛和2000年
7、3月国家重点基础研究项目评审会上,提到了“功能RNA组研究”。国外在2000年底提出了RNA组学的全新概念。RNA组学研究将会在探索生命奥秘中和促进生物技术产业化中,做出巨大贡献。,RNA组学 后基因组时代的科学前沿,美国科学介绍2000年重大科学成就时,把人类基因组工作草图绘制工作排在第一位,其中介绍了生命可能始于RNA而非DNA。2002年评出的“十大科学进展”中,排榜第一的发现“小RNA” 分子控制基因,显示小RNA是许多细胞遗传功能的主导。作为四级学科的 RNA研究多次获得次诺贝尔奖,表明RNA研究的重要性。,RNA组学(RNomics),对细胞中全部RNA分子的结构与功能进行系统的研
8、究,从整体水平阐明RNA的生物学意义即为RNA组学的主要任务。 RNA并非简单地传递遗传信息,而是通过各种类型的RNA剪接、RNA编辑和RNA再编码来控制遗传信息的表达。 它通过调控和催化蛋白质的生物合成而控制着生命的中枢。基因组学研究正全力构筑生命科学基石,RNA组学研究是它不可缺少的同盟军。,二 . 非编码RNA ( Non-coding RNA,ncRNA),基因组和转录,编码蛋白序列-人 基因组的2-3%-线虫 基因组的25%基因组的转录水平人 基因组90%线虫 基因组的70%绝大部分的转录产物是非编码RNA( Non-coding RNA,ncRNA)物种间最主要的差别也是ncRNA
9、,非编码RNA( Non-coding RNA,ncRNA),包括rRNA,tRNA,snRNA,snoRNA和miRNA等多种已知功能的 RNA,还包括未知功能的RNA。能从基因组上转录而来,但是不翻译成蛋白,在RNA 水平上就能行使各自的生物学功能。人基因组中有30亿个碱基对,其中1.5%能够编码蛋白质,98.5%是非蛋白质编码基因,这些基因序列一度被认为是“垃圾”基因。,ncRNA的作用,1. 影响染色体的结构。2. 调控转录。3. 参与RNA的加工,修饰。4. 参与mRNA的稳定和翻译调控过程。5. 影响蛋白质的稳定和转运。6. 在植物适应环境胁迫中的调控作用。7. 在细胞发育和分化中
10、的调控作用。,细菌RNAs- 小RNA(small RNA,sRNA)真核RNA-非编码RNA(Non-coding RNA, ncRNA)、功能性RNA(functional RNA, fRNA)、小非信使RNAs(small nonmessenger RNAs,snmRNA)根据亚细胞定位微小RNA(microRNA,miRNA)、小干扰RNA(small interfering RNA,siRNA)和长链非编码RNA(long non coding RNA,lncRNA)。,ncRNA的命名原则,1.大规模鉴定新ncRNA,用理论预测和实验发现。前者主要借助计算机,从已有的ncRNA中提
11、取特征信息,然后以特征信息做全基因组搜索。比较成功的预测软件有:预测snoRNA 的snoScan和snoGPS,预测tRNA 的tRNAScan,预测microRNA 的mirScan,RNAz,RNAmotif 等。理论预测方法简便快捷,但最终的确定还是依赖于实验,因此理论预测与实验验证是相辅相成。,ncRNA 的主要研究内容,这些方法被称作“RNomics”。核心在于构建ncRNA 的cDNA 文库,主要分为小于50 nt,50500 nt以及大于500 nt 3 种,另外对于大于500 nt 的还可以分为带polyA 尾巴和不带polyA 尾巴这两种.多种方法可用来鉴定文库中的ncRN
12、A。比较传统的是克隆测序,该法工作量很大,且对低丰度ncRNA 检测效率较差.操作流程比较简单,且对仪器设备要求不高,成本相对较低,因此仍广泛使用.,鉴定ncRNA的实验方法,随着测序技术的发展,得到ncRNA的cDNA 文库以后,不用克隆就可以直接测序.这种方法简单快捷,工作量小,可以检测到大量低丰度ncRNA.对仪器要求较高,成本也很高,使用的测序仪主要有454 和solexa 两种.随着技术的改进和成本的降低,这种直接测序的方法将成为主流.,454型测序仪, 速度快,一个测序反应耗时10个小时,获得4-6亿个碱基对。比传统的Sanger测序的方法快100倍; 读长长,单个序列的读长更长,
13、均匀可达到450个碱基左右; 通量高,每个反应得到超过100万个序列读长,成本降低; 正确度高,读长超过400bp时,单一读长的正确性超过99%; 一致性好,测序结果一致性超过99.99%; 可进行PairEnd测序研究; 简便高效,不需要进行建库、克隆挑取、质粒提取等工作,一个人可以在一天内完成一个微生物物种的测序工作.,Solexa 测序系统, 作为新一代测序技术,Solexa测序大大降低了测序成本,同时提高了测序效率; 每张芯片有8个通道,每个通道可单独运行一个样品,也可以把多个样品混合在一起检测; 一次单通道的测序可以得到不低于500万条的序列; 每次运行实验可读取10亿个碱基/芯片;
14、 可精确读取重复序列; 无需建库,自动化样品制备,简单,成本低; 样本使用效率极高,对少量样本也可以极灵敏精确地检测; 每次测序长度为30 nt左右.,核心在于构建高密度的覆盖全基因组的芯片,主要有affymetrix 公司和agilent 公司。优点在于不用构建cDNA 文库,更不用做克隆,只要有分离纯化的ncRNA就可以检测,操作简单,成本很低,可以检测到大量低丰度的ncRNA。缺点在于不能准确的确定ncRNA的转录起始终止位点,也很难区分剪切加工产物。,全基因组tiling 芯片技术,主要集中在microRNA 和siRNA,主要原因在于这两种小RNA的功能作用方式,都是通过同目标基因进
15、行碱基配对,寻找这些小RNA的靶点相对来讲比较容易;而对于长的ncRNA来讲,它们往往要形成复杂的二级甚至是三级结构,预测其靶点比较困难。随着研究的深入,也有为数众多的长的ncRNA的功能被鉴定出来,例如Xist 和Khps1 就属于长的带polyA 尾巴的ncRNA.环状RNA.,ncRNA的功能研究,传统意义中心法则,三. 微小RNA(microRNA,miRNA),1989年,Victor发现线虫中基因 lin-4 抑制基因 lin-14,认为 lin-4 应该也表达一种调控蛋白质;1993年,克隆出了 lin-4,却发现这个基因非常小,它的产物不是蛋白质,而是一个长度只有22个核苷酸的
16、RNA。它是由单链的RNA分子产生,这个分子的一端折回来形成不完全的互补配对的发卡结构。,miRNA研究起始于时序调控小RNA(stRNAs)。1993年,Lee等在秀丽新小杆线虫(Caenorhabditis elegan)中发现了第一个可时序调控胚胎后期发育的基因lin-4;2002年,Reinhart等又在线虫C.elegan中发现第二个异时性开关基因let-7.2001年10月science报道了三个实验室从线虫、果蝇和人体克隆的几十个类似C.elegan的lin-4的小RNA基因,称为microRNA。植物miRNA从2002年起才有报道,编码植物miRNAs的基因明显不同于其他生物
17、,植物编码miRNA基因的转录产物可能更大,植物的miRNA与互补结构的错配一般也少于动物,所以在进化上也更为保守.miRNA转录产物也是发夹状结构,在RNase酶切后以双链形式存在,最后释放互补链,miRNA成熟.,广泛存在于真核生物中的一组短小的,不编码蛋白质的RNA家族。由19-23个核苷酸组成的单链RNA(3端可有12个碱基长度的变化)。表达具有组织特异性和阶段特异性。即:在不同组织中表达有不同类型的miRNA,在生物发育的不同阶段里有不同miRNA表达。与靶mRNA 3-UTR结合,序列特异性在转录后水平调控基因的翻译表达,在生物发育、脂肪代谢、细胞分化、增殖和凋亡等过程中对着重要作
18、用。,miRNA特点,miRNA具有高度保守性,即各种miRNA都能在其它种系中找到同源体。miRNA独有的特征:其5端第一个碱基对U有强烈倾向性,而对G却有抗性;第二到第四个碱基缺乏U,除第四个碱基外,其他位置碱基通常都缺乏C;miRNA执行一定的生物学功能:对与其互补的mRNA表达水平具有调节作用;一些偏大的miRNA(27nt)可能参与了基因组的重组装;参与生物的发育与多种生理,病理进程。,四.miRNA研究方法,全面:AffymetrixGENEChip miRNA 2.0一张芯片上覆盖131个物种的miRNA,还包括人的2,334个snoRNA和scaRNA,并针对人、大鼠、小鼠的m
19、iRNA前体设计了2,202个探针组进行全面检测;灵敏:采用专利FlashTag BiotinRNALabeling Kits,Total RNA最低起始量最低可至100ng(要求纯化后的total RNA达到1g);检测线性范围大于1000;对85%的miRNA检测可检测到的1 attomoles;准确:芯片重复性好,片间和片内相关系数大于0.95;无需进行miRNA扩增,克服了研究miRNA的困难;质控完善:Affymetrix专业的探针设计和质控,保证杂交特异性.,高通量miRNA表达差异定量检测阵列,miProfile miRNA qPCR Arrays主要用于对感兴趣组织或细胞中mi
20、RNA的表达量进行分析,从而发现与您研究相关的特异miRNAs.每块96孔板(或384孔板)包含84 条(或360条)已交联在反应孔中的PCR引物(正向:miRNA特异引物;反向:通用引物),同时包含12个(或24个)用于监控从反转录到qPCR反 应的每个实验步骤效率的对照孔. 实验配套的All-in-One miRNA First-Strand cDNA Synthesis Kit 和 All-in-One qPCR Mix检测试剂及引物.,涵盖全基因组、预制和客户定制arrays.覆盖最多的全基因组miRNA.癌症与疾病相关arrays.定制miRNA arrays.性能优越:灵敏性能检测
21、低至10 pg小RNA或20 pg总RNA中的miRNA.特异性能检测miRNAs单碱基差异,每条引物的扩增效率和特异性均经过实验验证,宽广的线性范围能同时检测不同表达水平的miRNA.重复性批间和批内重复性好(R2 0.99).确证的miRNA引物.每条miRNA引物均使用专利算法设计并经过实验确证.,miProfile Custom miRNA qPCR Arrays客户定制miRNA表达量差异定量检测阵列,miProfile Custom miRNA qPCR Arrays 特为定量检测客户指定基因的表达量差异而设置。每对特定基因引物均使用专利算法设计并经过实验确证。根据检测基因数量和重
22、复次数,GeneCopoeia可提供6种96孔板和8种384孔板的排布方式供客户选择。定制产品同样包含各种不同种类的对照,用以监测样品质量、RT和PCR反应效率、复孔的重复性等。RT(Spike-in reverse transcription control):监测反转录反应效率.PCR(Positive PCR control):验证PCR反应效率.HK(Housekeeping genes):作为数据标准化过程中样品的阳性对照(内参基因).为达到Array产品的最佳性能,推荐使用配套试剂All-in-One miRNA First-Stand cDNA Synthesis Kit和All
23、-in-One qPCR Mix.,产品优势,验证引物 每条引物均使用专利算法设计并经过实验确证.灵活设计 提供6种96孔板和8种384孔板排布方式供客户选择.优越性能 灵敏度高 能检测低至10 pg小RNA或20 pg总RNA中的miRNA.特异性能检测miRNAs单碱基差异.线性范围宽 可同时检测到不同表达水平的miRNA.重复性好 批间和批内高重复性(R0.99).,GeneCopoeia 提供人、小鼠的全基因组、癌症、疾病等研究热点相关的miRNA表达差异定量分析阵列目录产品,也提供客户定制服务。,Disease and Focus-Group miRNA qPCR Arrays,Ol
24、igod(T)特异的RT引物(QIAGEN产品为主)由特异序列(T)20左右兼并碱基V或VN组成。(所有miRNA可以公用一个Oligod(T)的RT引物,但是RNA在反转录前需要进行末端Poly(A)加尾)。,由可以自身呈环茎状的特异序列6到8个miRNA3端反向互补碱基组成。(一条miRNA序列特异对应一个茎环状结构RT引)。,实时定量PCR,三种检测方法的比较,荧光原位杂交实验技术 Fluorescence in Situ Hybridization (FISH),FISH分类,应用改进的荧光原位杂交技术_FISH_定量分析单一细胞内miRNA的表达,miRNA功能研究(动物),五. 微
25、小RNA与疾病,肿瘤细胞与正常组织来源细胞间miRNA表达谱具有明显差异,且多数miRNA基因位于与肿瘤形成相关性脆弱基因位点,推测miRNA在肿瘤形成过程中可能扮演者重要的角色。在肿瘤发生发展过程中,miRNA通过调节癌基因或抑癌基因的表达,参与癌细胞重要细胞生物程序调控,间接起着“癌基因或抑癌基因”功能。miRNA 本身作为癌基因(如mir-17-92)或抑癌基因miRNA(如let-7),成为肿瘤治疗靶标。,miRNA与肿瘤,不同类型肿瘤具有特异性miRNA表达谱,根据miRNA表达水平可确定肿瘤组织或器官来源。miRNA具有肿瘤发生的阶段特异性,同一种肿瘤在发生发展不同分期阶段具有不同
26、的miRNA表达谱,可有效反映肿瘤发展与分化。miRNA与肿瘤的个体化治疗密切相关。不同miRNA表达谱与抗肿瘤药物疗效相关。,循环血清miRNA-新型肿瘤标志物,血液中miRNA表达稳定且稳定存在,血清与血浆中miRNA表达水平基本没区别。血清miRNA不易被RNA酶降解,室温孵育24 h或以上、反复冻融 (可高达8个冻融周期)、过酸、过碱、煮沸条件仍稳定。血清miRNA表达水平的变化与恶性肿瘤的病理过程密切相关,与相应肿瘤组织miRNA表达谱相关但不完全相同。,血清中miRNA的异常表达可作为肿瘤细胞存在的直接证据,具有很好的生物学标志物价值。相比于蛋白标志物,miRNA不仅检测准确率更高
27、,更易于实现多组分同时检测具有明显优越性。血液肿瘤、前列腺癌、肺癌、乳腺癌、口腔肿瘤、胃癌、结直肠癌、卵巢癌、胰腺癌、肝癌中作为特异诊断标志物。,血清miRNA与肿瘤的诊断,血清miRNA与肿瘤的治疗,一些miRNA可能增加肿瘤的化疗敏感性,将它们导入肿瘤细胞,化疗诱导的细胞死亡增加;抑制这些miRNA的表达,化疗诱导的细胞死亡则减少,这些miRNA大部分是肿瘤抑制miRNA。另一些miRNA可能导致肿瘤细胞耐受化疗.将这些miRNA导入肿瘤细胞,化疗诱导的细胞死亡减少;或者抑制miRNA的表达,化疗诱导的细胞死亡反而增加。目前虽然血浆或血清miRNA与个体化治疗关系的研究报道较少,但可以设想
28、,未来血浆或血清miRNA将应用于肿瘤治疗反应预测、治疗过程监测等方面。,以miRNA为靶点的肿瘤治疗,miRNA 在肿瘤的发生过程中起调控的枢纽作用,把其作为肿瘤生物治疗的靶分子将比编码基因作为靶分子更有效.引入抑癌基因性miRNA采用基因治疗的方法,导入相应的外源性miRNA.敲除或敲减癌基因性miRNA如某些特定的miRNA高表达,可采用多种方法下调或抑制相应miRNA的表达,设计抗miRNA的寡聚核甘酸(AMOs).miRNA及其靶基因多态性(single nucleotide polymorphisms,SNPs)与肿瘤的个体化治疗相关.,miRNA与转移肿瘤的治疗,使用RNA或DN
29、A分子作为治疗药物以抑制参与肿瘤转移基因的miRNA分子表达。干预参与肿瘤细胞扩散和浸润的miRNA分子。下调参与肿瘤血管生成的miRNA分子。抑制肿瘤干细胞表达的特异miRNA。鉴于miRNA常存在表观遗传修饰,设计兼有抗甲基化药物和组蛋白去乙酰基转移酶的表观遗传治疗。miRNA和反义miRNA药物目前处于临床前实验和体外毒性实验阶段。,血管生成相关的miRNA,血清miRNA与肿瘤的预后,研究表明,检测组织标本miRNA表达谱可以预测肿瘤患者的预后。血浆或血清miRNA在预测肿瘤预后方面也获得一些研究成果。血浆或血清miRNA与组织miRNA在不同肿瘤中的关系及作用应进一步阐明。探寻肿瘤发生、发展不同时期及不同医学治疗干预时个体血浆或血清miRNA表达谱的变化规律并阐明其机制,是血浆或血清miRNA应用于肿瘤个体化诊断治疗的一个关键问题。,miRNA功能研究的系统解决方案,