1、信息中心 张治中Z网上信息检索网上信息检索 搜索引擎 网上图书 网上学术期刊搜 索 引 擎搜索引擎的用途 网页搜索l 搜索包含指定关键字的网页。 各种类型的文件搜索l 软件安装程序 如 IE6.0的安装软件l 图片文件 如一朵玫瑰l 其他指定格式的文件搜索 如一首 MP3的歌曲、一个 Flash(SWF)动画文件搜索引擎的分类 一种是通过在互联网上提取各个网站的信息来建立自己的数据库,并向用户提供查询服务,因此是 真正的搜索引擎 ,如 Google、Excite、 天网、百度等。 另一种是 目录索引 ,仅仅是按目录分类,将网站列表并链接,用户完全可以不用进行关键词( Keywords) 查询,
2、仅靠分类目录也可找到需要的信息,实际上这种目录索引算不上是真正的搜索引擎。如 Yahoo等。工作原理 搜索引擎使用下面两种方法获得各个网站的信息,并保存到自己的数据库。l 定期搜索:即每隔一段时间,搜索引擎主动派出 “机器人 ”程序,对指定范围的 IP地址的互联网站进行检索,一旦发现新的网站,就自动提取网站的网页信息和网址加入自己的数据库。l 靠网站的拥有者主动向搜索引擎提交网址:它在一定时间内定向向提交的网站派出 “蜘蛛 ”程序,扫描该网站并将有关信息存入数据库,以备用户查询。 当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求相符的网站,便采用特殊的算法计算出各网页
3、的信息关联度,然后根据关联度高低,按顺序将这些网页链接返回给用户 常用的几种搜索引擎(http:/ ) 全文搜索lGoogle: http:/l 网易 (http:/)使用了它的全文搜索引擎服务l 百度: http:/l 新浪、搜狐、 21CN、 263、 TOM等使用了它的全文搜索引擎服务l 北大天网: http:/l 大量教育网内的资源,提供 FTP搜索搜索引擎的应用现状 从用户使用的角度,国外的调查发现:l 网上搜索信息的人很少考虑如何找到他们所需要的信息,因此搜索信息时象动物猎食般盲目;l 只有 18%的用户表示总能在网上搜索到需要的信息。 68%的用户说他们对搜索引擎很失望;l 平均
4、每个搜搜者在 12分钟的徒劳搜索后就感到恼火和受挫。l 46%的人只会用同一个关键词搜啊搜啊,而且是在同一个搜索引擎。国外的应用状况l 那些每周平均花 5个小时以上时间上网的人,将其上网时间的 71%都花在了搜索引擎上;l 人机界面高手 nielsen( google的设计者)研究表明:l 略超过 1/2的互联网用户属于 search-dominant, l 约 1/5用户属于 link-dominant,l 其它用户的搜索倾向属于混合行为型。 lsearch- dominant在到达一个网站后直接就奔向搜索按钮,他们对浏览网站不感兴趣,他们有明确的目的,倾向于以最快速度找到信息。l 相反,
5、link-dominant喜欢点击浏览一个网站,即使他们想找特殊信息时也是这样,只有在他们用点击超链的方法已经实在找不到了,才会想起搜索按钮。国内的应用状况 国内的调查发现:l cnnic2004年 1月的调查:l 61.6%的中国互联网用户经常使用搜索引擎(仅次于 E-mail)。l 83.4%的中国互联网用户得知新网站的主要途径是搜索引擎。 l 赛迪咨询的搜索引擎调查:截止 2000年 8月, 92.9%的网民使用过搜索引擎,同时有六成左右的网民将搜索引擎列为经常使用的网络服务。l 新浪搜索的统计表明:第 1条搜索结果获得的点击量,是第 2页第 1条的 150倍。l 百度公司: 百度 2004年中国互联网用户搜索热点统计值得推荐的几个中文搜索引擎 全文搜索l 衡量搜索引擎的指标:l 查全率l 查准率l 速度l 哪个重要?l Google: http:/l 新浪使用了它的全文搜索引擎服务l 说明:这是 2004年 4月的情形,各大门户网站使用的搜索引擎服务经常会变化,留意 Powered byl 百度: http:/l 21CN使用了它的全文搜索引擎服务l 中国搜索 (原来的慧聪搜索) http:/l 网易、搜狐、 263使用了它的搜索引擎。l 北大天网: http:/ l 大量教育网内的资源,提供 FTP搜索l 几大门户网站也有自己的搜索引擎,有时也能发挥作用。