生物序列的相似性搜索 blast 简介及其应用 中山大学生科院 2004年3月 1内容提要 1.基本概念 相似性,同源性 2.Blast 介绍 Blast 资源和相关问题 3.Blast 的应用 网络版 单机版 4.深入了解Blast( 改进程序,算法基础) 5.其他的序列相似性搜索工具(fasta ) 2生物序列的相似性 相似性: 是指一种很直接的数量关系,比如部 分相同或相似的百分比或其它一些合适 的度量。比如说,A 序列和B 序列的相似 性是80 ,或者4/5 。这是个量化的关 系。当然可进行自身局部比较。 3同源性: 指从一些数据中推断出的两个基因或蛋 白质序列具而共同祖先的结论,属于质 的判断。就是说A 和B 的关系上,只有是 同源序列,或者非同源序列两种关系。 而说A 和B 的同源性为80 都是不科学的 。 生物序列的同源性 4相似性和同源性关系 序列的相似性和序列的同源性有一定的关系,一 般来说序列间的相似性越高的话,它们是同源序 列的可能性就更高,所以经常可以通过序列的相 似性来推测序列是否同源。 正因为存在这样的关系,很多时候对序列的 相似性和同源性就没有做很明显的区