第五章 基因组序列注释n 完成基因组测序仅仅是基因组计划的第一步,更大的挑战在于弄清:n 基因组序列中所包含的全部遗传信息是什么;n 基因组作为一个整体如何行使其功能。n 这两项任务都必须依赖于对基因组序列的正确注释(annotation)。基因组注释方法: 自动注释:依据某些规则进行数据分析得出是否为基因的结论。 人工注释:人为检测评价自动注释的结果并根据其他数据进行分析与校正。 实验注释:根据实验结果进行检测,如EST或全长cDNA。自动注释的内容:n 依据基因结构的特点采用软件预测,不依赖已有的表达序列;n 同源性比较,在同一物种或不同物种中查找已有的基因序列;n 功能域(domain)或基序(motif)分析。基因序列注释基因功能注释5非翻译区 3非翻译区5.1 搜寻基因5.1.1 根据基因结构特征搜寻基因基因(gene). 开放读码框在DNA链上,由蛋白质合成的起始密码子开始,到终止密码子为止的一个连续编码序列称为一个开放读码框(open reading frame, ORF)。读码框(reading frame)n 任意一段DNA序列都有6种可能的读码框。n 终止密码子: