主题组织和关键词法汪春晖2009年3月1信息检索、组织及其实务课件搜索引擎的原理第一步:从网上采集信息2网页1链接1链接2网页2链接1链接2网页xx链接xx网页xx链接xx网页xx链接xx网页xx链接xx“蜘蛛”搜索引擎的原理索引:标题/网址 检索词网页x1 政协 会议网页x2 政协 委员网页x3 电脑 市场 3第二步:分析网页信息,建立网页索引数据库倒排索引:检索词 标题/网址政协 网页x1 网页x2 会议 网页x2电脑 网页x3 搜索引擎的原理45信息检索原理从技术上来说,信息检索是以信息的存储与检索之间的相符性为基础的,如下图“信息检索原理图”:标引检索输出存储过程一次信息信息特征检 索 语 言信息特征标识信息检索工具 (系统)检 索 结 果检索过程检索课题检索提问检索提问标识分析分析标引输入6什么是信息检索语言l 含义:是根据信息检索系统存储和检索的需要而是根据信息检索系统存储和检索的需要而编制的人工语言编制的人工语言。l 语言词汇语法信息检索语言的词汇:分类号、检索词、代码信息检索语言的语法:如何正确描述记录和有效地检索记录的一整套规则。主题语言的基本概念主题主题指信息对象所