1、长非编码RNA测序分析实战讲解之表达定量和差异及功能分析,卜德超QQ/微信号:530242830中国科学院计算技术研究所2014-1-3,步骤四:表达值的定量定量策略&工具步骤五:差异分析差异分析工具步骤六:功能注释附录:运行命令,3,转录组分析的通用套路,定量,鉴定,差异,功能,有多少RNA,RNA的表达量,结构、表达量、比例的变化,功能注释,测序数据,和参考基因组比对,测序评估及低质量过滤,编码基因表达注释,转录本重构,长非编码鉴定,长非编码表达注释,编码基因差异(特异)表达,GO功能显著性富集,Pathway显著性富集,功能富集网络图,长非编码差异表达,GO功能显著性富集,Pathway
2、显著性富集,功能富集网络图,Fusions,Junctions,Genome Browser可视化,转录组第五讲,测序中国-测序学堂转录组第三讲,转录组第四讲,转录组第六讲,步骤三:转录本的构建(Cufflinks/Scripture)构建流程详解基因存储文件: Gtf, Bed格式文件Cuffmerge/cuffcompare合并转录本转录本构建效果评估多外显子比率、已知覆盖程度步骤四:长非编码RNA的鉴定鉴定流程详解关键:如何判断编码或是非编码基因工具:CNCI,CPC, PhyloCSF,上期回顾,6,一个测序实例,取样:晚期肝癌病人的肝组织(共4个)癌旁组织(N)原发灶(P)转移灶(M
3、)门脉血栓转移灶(V),一组时间序列上的4个点的取样,步骤四:表达值的定量定量策略&工具步骤五:差异分析差异分析工具步骤六:功能注释附录:运行命令,8,转录组分析的通用套路,定量,鉴定,差异,功能,有多少RNA,RNA的表达量,结构、表达量、比例的变化,功能注释,鉴定完成后的分析步骤,9,定量策略,FPKMexpected number of fragments per kilobase of transcript sequence per millions base pairs sequencedTPMtranscript per millionRPKMreads per kilobase
4、per million mapped reads,10,定量,工具:Cufflinks(FPKM)Cuffdiff(FPKM)推荐RSEM(TPM) 推荐Range(RPKM),FPKM定量,计算工具:cufflinks输出结果transcripts.gtfisoforms.fpkm_trackinggenes.fpkm_tracking,转录本定量? 基因定量?,定量:cufflinks -G ref.gtf o outdir tophat_outdir_N /accept_hits.bam,长编码RNA表达定量,蓝线:长非编码基因,黑线:非编码基因,N,P,M,V,步骤四:表达值的定量定量
5、策略&工具步骤五:差异分析差异分析工具步骤六:功能注释附录:运行命令,14,差异分析,差异分析工具:DeseqHypothesis testingH0:no difference between tow conditions. Negative Binomial for reads countCuffdiffTest A.FPKM - B.FPKM with normal distributionSAMseqNonparametric methodsMann-Whitney statisticNeed many samples/replicates in conditionsEBseqEmpi
6、rical Bayesian mode(for TPM),Cuffdiff输出结果,isoforms_exp.diffgenes_exp.diffsplicing.diffthe relative contribution of different isoforms is significantly differenttissue 1 is 80/20 for two isoforms and tissue 2 is 50/50tss.diff,表达差异分析结果,P/N M/N V/N = 342 coding genes,P/N M/N V/N = 312 lincRNA genes,17,
7、动态变化分析(特异性分析),JS score ranging from 0 to 1;,Jensen-Shannon (JS) Score,A perfect tissue-specificpattern will be scored as JS = 1,18,动态变化分析(特异性),步骤四:表达值的定量定量策略&工具步骤五:差异分析差异分析工具步骤六:功能注释附录:运行命令,20,功能注释,工具:David Go(For coding genes)http:/david.abcc.ncifcrf.gov/ncFANs(for lincRNAs)https:/www.bioinfo.org/n
8、cfansv2/,David GO: 数据上传,David GO: 注释数据库选择,GOTERM_BP_FAT,KEGG_PATHWAY,David GO: Functional Annotation Clustering,David GO: Functional Annotation Chart,25,功能注释,步骤四:表达值的定量定量策略&工具步骤五:差异分析差异分析工具步骤六:功能注释附录:运行命令,运行命令汇总,差异分析&定量:,cuffdiff -o cuffdiff_outdir T -labels N,P,M,V refgene.gtf N.bam P.bam M.bam V.bam,Cuffdiff2: http:/