1、浅谈网络环境下信息检索服务的需求特点及智能检索服务的相关技术分析论文关键词: 信息检索 搜索引擎 智能代理 挖掘技术 论文摘要:以现阶段网络环境下信息检索的需求特点为出发点,为实现以人为信息中心、信息主导的理念,提出智能检索的含义,并分析实现该功能的主要相关技术。 0 引言 随着网络应用的不断普及,网络已经成为人们获取信息的重要场所。在对新的检索工具和检索技术进行探索和研究的过程中,应克服当下网络信息检索给我们带来的困难,加强对不同需求进行信息搜集和发送的智能化服务功能。 1 网络环境下信息检索的特点 1.1 数据量巨大。在网络环境下,数据量大的惊人。大数据量会导致一些难以预料的软件异常,流量
2、也会难以控制,对各个环节的策略和算法选择将会更加复杂。 1.2 多用户服务。多用户模式的信息检索服务必须注重快速反应,注重对并发访问的支持,对公共数据的共享,对临时工作数据的清理等。如果要针对不同用户开展不同服务,就要获取并管理不同用户的个性化需求,使大量的信息通过不同的渠道,主动送到用户的手上。 1.3 用户层次复杂。网络环境下信息检索服务的用户中,大多数都不是专业用户,他们的层次区别较难,拥有不同的操作技能和操作知识,面对这些非专业的用户,将更加需要人性化的引导式信息服务。 2 智能化信息检索的含义 智能化信息检索是在信息检索的基础上提出来的,它是以用户为中心的信息检索技术,为不同用户提供
3、不同的服务,并满足同一用户在不同时期的需求,通过收集和分析用户信息来学习用户的兴趣和行为,并综合利用这些用户信息,提高信息检索系统的性能,满足用户的个体信息需求。在具体实现过程中主要是通过观察和分析用户的搜索行为,从中识别出用户对信息需求的偏好,并且能够根据用户对搜索结果的评价,自觉地调整搜索策略,使得对于不同的检索请求,不同用户都能够得到最贴近自己需要的信息服务。 3 信息检索服务的主体技术 网络信息检索通常采用搜索引擎技术,该技术是为了解决“信息迷航”问题而提出的。它通过相应的算法在互联网上搜索相关信息,并对信息进行组织和处理,从而为用户提供信息导航。 现阶段,网络搜索引擎有很多,用户比较
4、常用的有 Google、有道、百度等等,这些搜索引擎能进行网络信息检索、信息过滤、个性化信息服务定制等比较有特色的服务,但是并没有实现真正意义上的智能化检索。在实际使用过程中,用户想要的不仅仅是有用的信息,他们更希望做信息消费的主人,使信息的搜索可以在一个相对主动的环境中进行。 4 智能信息索引的相关技术 要实现真正意义上的以自我为中心的检索服务就需要以下的相关技术进行支撑。 4.1 智能代理技术。智能代理又可以称之为智能体,它是在用户没有明确具体要求的情况下,根据用户需要,代替用户进行各种复杂的工作,如信息检索、筛选及整理,并能推测用户的意图,自动制定、调整和执行工作计划。 智能代理首先要建
5、立个性化的数据库,在数据库中建立用户基本信息表(包括用户编号、用户名、姓名、年龄、性别等字段) 、用户职业信息表(包括职业编号、职业类型、等级、职称等字段)和用户兴趣信息表(包括兴趣编号、兴趣类别、程度等字段) ,用来详细描述用户的个人情况,其中第一个字段可以设置成关键字。 然后建立用户检索策略表(包括策略编号、策略控制、检索词控制、检索时间控制、检索范围控制等字段)和用户检索评价表(包括检索编号、检索时间、检索词、检索结果数量、查全率、查准率等字段) ,同样的,第一个字段设置成关键字。检索策略表主要是给用户模型的检索定义一个比较完整的检索策略,检索评价表主要是对用户检索的满意度作一个简单的评
6、价描述。 有了用户个性化数据库,一方面,在服务器端吸收智能代理技术的思想,引入个性化服务的理念,引入用户反馈机制来完善检索机制、提高检索命中率,同时也可提供面向个人的特殊检索服务。另一方面,信息检索用到智能代理主要集成在客户端,配合用户兴趣完成搜索,它会对用户信息需求、偏好进行区别、归纳、总结,分析用户的兴趣爱好,并借助学习的规则,自动、独立地代理用户查找用户感兴趣的信息。 4.2 用户兴趣挖掘技术。实现信息检索服务最重要的就是对用户的喜好和习惯进行分析,日前,通常使用两种方法:其一是通过用户主动提供自己的兴趣来得到用户的个性化向量;其二是在用户没有明确参与的情况下,系统通过观察用户行为来得到
7、用户的兴趣,从而得到用户的个性化向量。使用第一种方法,可以选择下面两种方式:一是用户将自己感兴趣的信息类或在线文档分类后提供给系统,系统从这些文档或信息类中发现用户的兴趣;二是用户提供自己的研究方向和其它阅读爱好等信息,系统从这些信息中发现用户的兴趣。但是,由于用户的兴趣并不是一成不变的,而用户一般不可能提供所有的兴趣以及感兴趣的程度,因此还需要使用第一种方式进行补充。使用第二种方法是根据用户对推送页面的评价信息来更新用户的个性化向量。 5 结束语 智能化信息检索技术现在已经成为一项被广泛研究的领域,它需要多种技术相支持,我们虽取得一些成绩,但是道路还很漫长,真正实现信息搜索的智能化服务,还有待代理技术的智能性、主动性、自主性等得到进一步的提高。 参考文献: 1赵刚,网络环境下信息检索研究J.内蒙古科技与经济,2010(12):130132. 2陈维、阮海红,网络环境下的信息检索与数据挖掘技术,现代情报,2009(5):144146.