精选优质文档-倾情为你奉上研究搜索引擎 剖析搜索引擎算法(1)通用搜索引擎对所有网页和文件进行收录整理并提供搜索服务,又可以分为两类,一类以Google为代表,几乎完全是由程序自动控制整个流程,人为的干预很少,效率比较高,比较公平,但缺点是由于程序的信息处理能力的局限性,对于网页内容的分类不够准确,有可能给用户提供实际并不需要的页面链接;另一种以Yahoo为代表,依靠人工建立庞大细致的分类体系,方便用户找到自己最需要的页面,这样可以最大限度保证分类的准确性,但是互联网上的信息量正以前所未有的速度增长,人工分类的效率相比之下就过于低下了,不能满足“查全”的要求。(2)专业搜索引擎针对某一特定领域或特定文件类型进行收录整理并提供搜索服务。例如CiteSeer,就是典型的专业搜索引擎。其他的如北大天网FTP搜索引擎,专门针对FTP目录下的文件进行搜索;最近随着博客(网络日志)兴起而兴起的博客搜索引擎,由于博客的分类机制比较稳定,而且博客的世界里常常关心的是最新的最有意思的一些新闻,因此未来很可能有大的发展;音乐搜索引擎、电影搜索引擎,针对特定的音频、