1、第 9章 搜索引擎的应用与评价 9.1 搜索引擎的基本概念 9.1.1 搜索引擎定义搜索引擎( Search Engine)是一种用于帮助互联网用户查询信息的搜索工具,它以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。9.1.2 搜索引擎的历史1994年春天, Michael Mauldin将 John Leavitt的 spider程序接入到其索引程序中,创建了最早的真正意义上的搜索引擎 Lycos。接着, Yahoo也在当年成立。今天搜索引擎的核心是网络导航服务,有时搜索引擎成了门户网站的代名词,它们不仅提供网站搜索服务
2、,还提供新闻、在线图书馆、词典,以及其它网络资源,涉及面越来越广。9.1 搜索引擎的基本概念 9.1.3 搜索引擎的分类搜索引擎按其工作方式分为两类:网站分类目录搜索引擎和基于关键字检索的搜索引擎。 网站分类目录搜索引擎网站分类目录搜索引擎通过人工建立一个结构化的分类目录体系,将搜索到的网站划分到各个类别及子类下,并将每个网址抽象为一段摘要性信息,作为对该网站的概括介绍。它的优点是层次清楚,方便用户简单准确地查找某一方面的信息,设计上也更简单、容易实现;缺点是靠人工操作工作量太大,因而搜索的站点少,更新慢;如果用户对查询问题的类目划分与该分类体系不一致,则有可能找不到相应的类目,搜索只在网站摘
3、要而不是全文中进行,不够全面。 9.1 搜索引擎的基本概念 9.1.3 搜索引擎的分类 基于关键字检索的搜索引擎基于关键字检索的搜索引擎,可以根据用户用逻辑组合方式输入的各种关键字( Keyword),寻找用户所需资源的地址,然后根据一定的规则反馈给用户包含此关键字词信息的所有网页的内容摘要和指向这些网页的链接。随着互联网信息的快速增长,搜索引擎利用其内部的 Spider(蜘蛛)或者 Robots(机器人)程序,自动搜索一定范围内所有网站每个网页的头部信息,并把每页用于描述网页性质所有词汇作为关键字与网页的 url地址一同放入数据库供用户查询。基于关键字检索的搜索引擎很多,下面列举一些具有代表性的网站及其搜索引擎。