1、第五章 序列同源比较与系统发育学分析 主要内容5.1 概述 5.2 序列比对5.3 系统发育分析 5.1 引 言一、序列比对的概念序列比对( align): 是指通过将两个或多个核酸序列或蛋白质序列进行比较,找出其中相似的结构区域。两个序列的比对是指这两个序列中各个字符的一一对应关系,或字符的对比排列 。二、序列比对的生物学意义1 通过比较未知序列与已知序列之间的同源性,往往 可以很容易地预测未知序列的功能。 (功能预测)2 通过分析多个基因或蛋白质序列之间的同源性确定 它们在进化上的关系。 (确定进化关系)3 通过多序列比对,帮助判断残基如何发挥作用以维 持蛋白质或 DNA 序列的功能。同时
2、,通过多序列比对可以获得重要残基周围的三级结构。 (判断残基作用)4 通过蛋白质多序列比对,也有助于蛋白结构的预测。(蛋白质结构预测)三、序列比对基本原理1 记分矩阵( Scoring matrix)DNA记分矩阵在进行序列比对过程中,有两方面的问题直接影响相似性分值: 记分矩阵 和 空位罚分 。蛋白质记分矩阵PAM矩阵BLOSUM 622 空位罚分 (gap penalty)空位罚分是为了补偿插入或缺失对序列相似性的影响。但由于没有合适的理论模型能很好地描述空位问题,因此空位罚分缺乏理论依据而更多的带有主观特点。空位罚分处理方法:1)对第一个空位罚分,如 10-152)对空位的延伸罚分,如 1-2搜索比对结果不同的比对程序所采用的记分矩阵和罚分规则不同,因而对同一组数据比对的结果也会有很大差异。