基于隐性反馈的个性化检索 --用户行为资料收集研究---毕业论文

1、本 科 毕 业 论 文基于隐性反馈的个性化检索-用户行为资料收集研究Based on Implicit Feedback of Personalized retrieval- Search and study of user behavior data collection姓 名:学 号:学 院:软件学院系:软件工程专 业:软件工程年 级:指导教师: 年 月摘要随着因特网的迅猛发展,网络已成为人们获得信息的重要途径和手段,网路中的海量信息既给人们带来了方便,也带来了许多问题。网络中的信息内容庞杂, 组织松散,为找到有用信息,人们经常要花费大量的时间,所以近年来因特网个性化搜索服务越来越引起人们

2、的关注。搜索引擎由于没有考虑到用户个人的兴趣爱好,不同用户对于同样的检索关键词检索出的信息是相同的,这样做并不能完全满足用户的要求。因此基于用户兴趣的个性化搜索服务已成为人们研究与开发的热点。本文主要介绍了基于隐性反馈的个性化检索的相关概念,并详细介绍了如何通过对用户行为资料的收集研究,隐性的分析和总结用户的喜好兴趣。并通过上下文相关算法,为用户提供个性化搜索服务。关键词: 用户行为资料; 隐性反馈; 上下文;AbstractsWith the rapid development of Internet, the network has become an important means of

3、 access to information. Mass information from the network not only brings convenience, it also brings many problems. Information network is complex and loosely organized. In order to find useful information, people often have to spend a lot of time, so in recent years, personalized Internet search s

4、ervice has attracted attention. Because search engines do not take into account the individual interests of users, different uses searching for the same search keyword get the same result as it does not fully meet the customers requirements. Therefore personalized search service based on user intere

5、st has become a hot research and development. In this paper, based on implicit feedback of the personalized search related concepts, we focus on how to analyze and summarize the implicit preferences of the users interest through information collection of user behavior research and to provide users w

6、ith personalized search service through context-sensitive algorithms .Keywords: Implicit feedback; Information on the context of user behavior;Context目录第一章 绪论 .11.1 研究背景 .11.2 国内外研究现状 .31.3 论文主要工作 .41.4 论文组织结构 .4第二章 个性化搜索与用户行为资料收集研究 .62.1 个性化搜索概述 .62.1.1 搜索技术的新战场 .62.1.2 个性化搜索 .72.1.3 个性化搜索引擎 .72.1.

7、4 个性化搜索服务 .72.2 个性化信息概述 .72.2.1 用户搜索行为 .82.2.2 用户短期搜索行为信息 .92.2.3 用户长期搜索行为信息 .92.3 个性化信息获取 .102.3.1 服务器端分析 .102.3.2 用户主动提供 .102.3.3 系统被动学习 .11第三章 短期上下文个性化检索算法 .123.1 个性化信息获取技术 .123.1.1 显式相关反馈 .123.1.2 隐式相关反馈 .133.2 短期上下文下的个性化检索算法 .133.3 用户短期模型 .15第四章 Firefox 插件开发 .194.1 引言 .194.2Firefox 插件开发 .194.2.

8、1 插件开发基础 .194.2.2 Firefox 常用插件 .214.3Firefox 插件的具体实施 .244.3.1Firefox 插件的系统架构流程图 .244.3.2 用户行为搜集流程图 .254.4 插件的结构 .264.5 插件的效果图 .27第五章 个性化搜索平台设计和实现 .285.1 个性化搜索平台的一般架构分析 .285.2 个性化搜索引擎组件设计 .295.3 系统架构图 .315.4 个性化搜索平台实现 .32第六章 结论 .34参考文献 .35致谢 .36ContentsChapter 1 Introduction .11.1 Background.11.2 Res

9、earch at home and abroad.31.3 Working paper.41.4 Thesis Structure.4Chapter 2 personalized search and study of user behavior data .62.1 Personalized Search Overview.62.1.1 The new search technology battlefield.62.1.2 Personalized Search .72.1.3 Personalized search engine .72.1.4Personalized Search se

10、rvice .72.2Personal Information 2.2 Overview.72.2.1User search behavior .82.2.2Users of information search behavior of short-term .92.2.3Analysis of user search behavior of long-term .92.3Personalized information access.102.3.1Server-side analysis .102.3.2Users take the initiative to provide.102.3.3

11、System passive learning.11Chapter 3Short-term context of personalized search algorithm .123.1personalized information access to technology .123.1.1Explicit relevance feedback .123.1.2Implicit relevance feedback .133.2Short-term context of personalized search algorithm.133.3short-term model of users.

12、15Chapter 4 Firefox Plug-in Development .194.1 Introduction.194.2 Firefox Plug-in Development.194.2.1 Plug-in Development based on .194.2.2 Firefox commonly used plug-ins .214.3 Firefox concrete implementation of plug-ins.244.3.1 Firefox plug flow chart of the system architecture .244.3.2 The flow c

13、hart 27, the collection of user behavior.254.4 plug-in structure.264.5 the effect of plug-ins.27Chapter 5 Personalized Design and Implementation of Platform.285.1 Personalized Search of the general framework analysis .285.2 Personalized Search Engine Component Design.295.3 System Architecture Figure

14、.315.4 Personalized Search platform.32Chapter 6 Akeknowlegements.34References.35Regards .36基于隐性反馈的个性化检索-用户行为资料收集研究1第一章 绪论随着互联网技术的迅猛发展,信息呈爆炸式的增长。一方面,互联网提供着丰富的信息,可以毫不夸张的说,互联网已经成为了一个信息世界;另一方面,互联网世界又是一个杂乱的世界,信息存储非常随意自由。寻找资料已不如过去来的简单,如何从海量、杂乱的信息中快速找出用户所需要的信息已经成为一个日益凸显的问题,于是基于用户兴趣的个性化搜索服务已成为人们研究与开发的热点。1.1

15、 研究背景1)第一代搜索引擎:无论是纯技术型的搜索引擎还是分类目录,都可以认为是互联网上的第一代搜索引擎,出现于 1994 年前后,以 Altavista、YAHOO 和 Infoseek 为代表,搜索结果的好坏往往用反馈结果的数量来衡量,也就是说,第一代搜索引擎“求全”。然而,第一代搜索引擎性能并不是想象中的那么优秀,在全球 11 个主要的搜索引擎中,搜索引擎仅能搜索到国际互联网上全部页面的 16%,甚至更低,造成这种情况的原因,主要是因为这些搜索引擎没有及时更新他们的资料。2)第二代搜索引擎1998 年,以 Google 和 DirectHit 为代表的第二代搜索引擎出现在互联网上,这些引

16、擎的主要特点是提高了查准率,可以用“求精 ”来描述。互联网上的第二代搜索引擎伴随互联网信息量的爆炸式增长。第一代搜索引擎由于技术的限制,很难覆盖整个互联网的大部分内容。链接分析技术的引入,真正提高了自动搜索引擎的结果质量。搜索引擎真正跨入第二代自动搜索引擎。搜索引擎系统以基于隐性反馈的个性化检索-用户行为资料收集研究2信息自动抓取和自动排序检索为特征。3)第三代搜索引擎互联网上的第三代搜索引擎甚至式第四代目前正在发展和形成当中。大多数人认为正在发展中的第三代和第四代搜索引擎则分别为“求专” 和“求易”。总结起来无论是第三代还是第四代搜索引擎,个性化、分类化和智能化是公认的新搜索引擎所应该具备的

17、特征。当今网络上的信息海量并杂乱,其中相当多的东西是重复,甚至于“垃圾化”第一代、第二代搜索引擎的“求全” 、 “求精”精神已经无法满足用户快速寻找的需求。所以第三代搜索引擎应运而生,它迫切解决前两代搜索引擎乃至自身所存在的缺陷:1) 无法适应用户具体兴趣现有大部分搜索引擎采用的都是关键词输入方式进行检索。所有用户都采用在同一种模式,输入自己所认为的关键字,然后搜索引擎返回一个按相关度排序的结果。而这个结果对所有的用户都是一样的,没有考虑到具体用户的具体查询需求,从而导致用户对查询结果满意度的降低。而且有时用户也无法准确地表述自己的兴趣。尽管现在很多搜索引擎为此行了改进,也确实改善了检索效率。但由于没有根据用户具体兴趣提供相应的个性化模式共享机制,所以并不能很好地适应用户兴趣变化。2) 用户与搜索引擎的交互方式比较单调针对不同用户的具体需求,提供不同的输入方式是目前大部分搜索引擎所缺少的。大部分搜索引擎返回的结果是以一个按相关度排序的结果文档集合分页显示的方式进行结果反馈的,这样的显示方式并不能完全满足用户的具体需求,因为用户可能需要一个不一样的返回结果。传统的搜索引擎用户对检索系统的使用上无法进行个性化的操作,导致了搜索引擎对用户的查询意图理解模


