资源描述
长非编码RNA测序分析实战讲解之表达定量和差异及功能分析,卜德超
budechao@ict.ac.cn
QQ/微信号:530242830
中国科学院计算技术研究所
2014-1-3,步骤四:表达值的定量
定量策略&工具
步骤五:差异分析
差异分析工具
步骤六:功能注释
附录:运行命令,3,转录组分析的通用套路,,,,定量,鉴定,差异,功能,有多少RNA,RNA的表达量,结构、表达量、比例的变化,功能注释,测序数据,和参考基因组比对,测序评估及低质量过滤,编码基因表达注释,转录本重构,长非编码鉴定,长非编码表达注释,编码基因差异(特异)表达,GO功能显著性富集,Pathway显著性富集,功能富集网络图,长非编码差异表达,GO功能显著性富集,Pathway显著性富集,功能富集网络图,Fusions,Junctions,,Genome Browser可视化,,,转录组第五讲,,,测序中国-测序学堂
转录组第三讲,转录组第四讲,转录组第六讲,步骤三:转录本的构建(Cufflinks/Scripture)
构建流程详解
基因存储文件: Gtf, Bed格式文件
Cuffmerge/cuffcompare合并转录本
转录本构建效果评估
多外显子比率、已知覆盖程度
步骤四:长非编码RNA的鉴定
鉴定流程详解
关键:如何判断编码或是非编码基因
工具:CNCI,CPC, PhyloCSF,上期回顾,6,一个测序实例,取样:晚期肝癌病人的肝组织(共4个)
癌旁组织(N)
原发灶(P)
转移灶(M)
门脉血栓转移灶(V),一组时间序列上的4个点的取样,步骤四:表达值的定量
定量策略&工具
步骤五:差异分析
差异分析工具
步骤六:功能注释
附录:运行命令,8,转录组分析的通用套路,,,,定量,鉴定,差异,功能,有多少RNA,RNA的表达量,结构、表达量、比例的变化,功能注释,,鉴定完成后的分析步骤,9,定量策略,FPKM
expected number of fragments per kilobase of transcript sequence per millions base pairs sequenced
TPM
transcript per million
RPKM
reads per kilobase per million mapped reads,10,定量,工具:
Cufflinks(FPKM)
Cuffdiff(FPKM)推荐
RSEM(TPM) 推荐
Range(RPKM),FPKM定量,计算工具:cufflinks
输出结果
transcripts.gtf
isoforms.fpkm_tracking
genes.fpkm_tracking,转录本定量? 基因定量?,定量:cufflinks -G ref.gtf –o outdir tophat_outdir_N /accept_hits.bam,长编码RNA表达定量,蓝线:长非编码基因,黑线:非编码基因,N,P,M,V,步骤四:表达值的定量
定量策略&工具
步骤五:差异分析
差异分析工具
步骤六:功能注释
附录:运行命令,14,差异分析,差异分析工具:
Deseq
Hypothesis testing
H0:no difference between tow conditions.
Negative Binomial for reads count
Cuffdiff
Test A.FPKM - B.FPKM with normal distribution
SAMseq
Nonparametric methods
Mann-Whitney statistic
Need many samples/replicates in conditions
EBseq
Empirical Bayesian mode(for TPM),Cuffdiff输出结果,isoforms_exp.diff
genes_exp.diff
splicing.diff
the relative contribution of different isoforms is significantly different
tissue 1 is 80/20 for two isoforms and tissue 2 is 50/50
tss.diff,表达差异分析结果,P/N ∪ M/N ∪ V/N = 342 coding genes,P/N ∪ M/N ∪ V/N = 312 lincRNA genes,17,动态变化分析(特异性分析),JS score ranging from 0 to 1;,Jensen-Shannon (JS) Score,A perfect tissue-specific
pattern will be scored as JS = 1,18,动态变化分析(特异性),步骤四:表达值的定量
定量策略&工具
步骤五:差异分析
差异分析工具
步骤六:功能注释
附录:运行命令,20,功能注释,工具:
David Go(For coding genes)
http://david.abcc.ncifcrf.gov/
ncFANs(for lincRNAs)
https://www.bioinfo.org/ncfansv2/,David GO: 数据上传,,,,David GO: 注释数据库选择,,,,,GOTERM_BP_FAT,KEGG_PATHWAY,David GO: Functional Annotation Clustering,,David GO: Functional Annotation Chart,25,功能注释,,步骤四:表达值的定量
定量策略&工具
步骤五:差异分析
差异分析工具
步骤六:功能注释
附录:运行命令,运行命令汇总,差异分析&定量:,cuffdiff -o cuffdiff_outdir –T --labels N,P,M,V refgene.gtf N.bam P.bam M.bam V.bam,Cuffdiff2: http://www.nature.com/nbt/journal/v31/n1/full/nbt.2450.html,,谢谢大家,
展开阅读全文
相关搜索