2010-3-81、广义的搜索引擎是指信息用户为处理和解决问题而查找、识别、获取相关的事实、文献和数据的活动及过程。狭义的搜索引擎是指信息用户在信息检索系统上的信息查询行为。2、信息检索涉及三个重要的处理过程:文档集的逻辑表示、用户查询信息的表示、相似匹配。因此信息检索是一个三元体的框架,D为文档集中的一组文档逻辑视图(文档),Q为一组用户信息需求的逻辑视图表示(用户查询),R(Q,D)表示文档与用户查询之间联系的相关度函数。3、面向用户的个性化服务成为主流,是一个四元组框架,多个U,为R(Q,D,U)。4、信息检索模型表达方式:布尔模型、向量空间模型、概率模型和逻辑模型等。向量空间模型更适合网络Web文本信息检索要求。5、向量空间模型:用不同的词语项集来表达不同的Web网页文档,所有用语的集合构成了一个N维文档空间。Web文档集合中的任何一篇文档都可以表示为这个多维空间中的一个向量,因此称为文档向量。文档向量在每个词语维度上的取值能反映该词语在该文档中的权重。把网页文档看成是一组词语(T1,T2,Tn)构成的序列。Wi为坐标值。网页文档可表示为(T1,W1