1、1,实习二 真核生物基因结构的预测分析,浙江加州国际纳米技术研究院2010年11月,苏锟楷 楼小燕 韩 序 蒋 琰,2,课程内容,基因组学,转录物组学,蛋白质组学,系统生物学,3,基因组序列cDNA序列,基因组功能分析,4,真核生物基因的主要结构,5,基因结构分析常用软件,6,开放读码框的识别,开放读码框(open reading frame, ORF) 是一段起始密码子和终止密码子之间的碱基序列ORF 是潜在的蛋白质编码区,7,8,ORF识别:GENSCAN,http:/genes.mit.edu/GENSCAN.html,9,9,GENSCAN输出结果:文本,10,10,GENSCAN输出
2、结果:图形,11,ORF识别: GenomeScan,http:/genes.mit.edu/genomescan.html,12,GenomeScan输出结果:文本,13,GenomeScan输出结果:图形,14,课堂练习,1使用GENESCAN预测序列中可能的ORF。2使用GENOMESCAN预测序列中可能的ORF。练习用的序列文件在c:zcnishixi2文件下,名字为clone.fasta,使用写字板打开查看。,15,转录调控序列分析 CpG岛、转录终止信号和启动子区域的预测,16,CpG岛的预测,CpG岛常位于真核生物基因转录起始位点,GC含50% ,长度200bp的一段DNA序列。
3、,17,CpG岛的预测:CpGPlot,http:/www.ebi.ac.uk/emboss/cpgplot/index.html,19,GENESCAN 预测结果起始为532bp 终止于51783bp,20,转录终止信号,上游作用元件:AAUAAA,下游作用元件:GC rich二重对称区、UUUUUU,21,转录终止信号预测:POLYAH,http:/ 位于结构基因5端上游,能活化RNA聚合酶,使之与模板DNA结合并具有转录起始的特异性。转录起始位点(Transcription start site, TSS)PYCAPY(嘧啶)核心启动子元件(Core promoter element)T
4、ATA box,Pribnow box (TATAA)上游启动子元件(Upstream promoter element,UPE)CAAT box,GC box,SP1,Otc增强子(Enhancer),24,原核和真核生物基因转录起始位点上游区结构,原核生物,真核生物,上游启动子元件,UPE,核心启动子元件,转录起始位点,25,启动子结合位点分析常用软件,26,启动子预测:PromoterScan,http:/www-bimas.cit.nih.gov/molbio/proscan/,27,PromoterScan输出结果,28,课堂练习,1 使用CpG Plot预测基因的CpG islan
5、d位置。2 使用PolyAH预测基因可能的转录终止的位置。3 使用PromotorScan寻找基因上游序列里可能的转录因子调控区域。,基因密码子偏好性,29,1.研究蛋白质结构功能中的作用2.在表达外源基因方面的作用3.在生物信息学研究中的作用,基因密码子偏好性: CodonW,30,31,参 数 选 择,32,CodonW结果界面,课堂练习,使用CodonW分析基因的密码子使用偏好,了解密码子偏好分析中各指数的含义。,33,34,内含子/外显子剪切位点识别,如何分析核酸序列中的外显子组成?通过对特征序列(GT-AG)的分析进行直接的预测基因预测软件(NetGene2)与相应的基因组序列比对,
6、分析比对片段的分布位置(Spidey),35,36,剪切位点识别:NetGene2,http:/www.cbs.dtu.dk/services/NetGene2/,37,NetGene2输出结果,38,mRNA剪切位点识别:Spidey,NCBI开发的在线预测程序用于mRNA序列同基因组序列比对分析,http:/www.ncbi.nih.gov/spidey,39,Spidey同源序列的获得:序列比对,通过BLAST进行序列比对,找到可能同源的相似性好的一系列mRNA序列。,40,41,Spidey输出结果,42,课堂练习,1 练习两种预测剪切位点的软件的使用,NetGene2和Spidey。
7、2 Spidey的同源序列文件保存在c:zcnishixi2文件下,名字为Spidey.txt,使用写字板打开查看。,43,选择性剪切(Alternative splicing)分析,选择性剪接是调控基因表达的重要机制了解不同物种、细胞、发育阶段、环境压力下基因的调控表达机制,44,选择性剪接的类型,选择性剪切的五种基本类型: 内含子保留. 5端选择性剪切位点. 3端选择性剪切位点.外显子遗漏. 互斥外显子.,45,查询选择性剪切相关的网站,从已知基因的功能推测剪切机制,46,选择性剪切查询:ASTD数据库,http:/www.ebi.ac.uk/astd/main.html,47,ASTD数据库检索结果:基因描述信息,48,ASTD数据库检索结果:选择性剪切的mRNA,十一种选择性剪切产物,49,ASTD数据库检索结果:表达的组织特异性,50,Thanks!,51,