语义网在数字图书馆信息检索中的应用.doc

上传人:gs****r 文档编号:1867902 上传时间:2019-03-18 格式:DOC 页数:5 大小:104KB
下载 相关 举报
语义网在数字图书馆信息检索中的应用.doc_第1页
第1页 / 共5页
语义网在数字图书馆信息检索中的应用.doc_第2页
第2页 / 共5页
语义网在数字图书馆信息检索中的应用.doc_第3页
第3页 / 共5页
语义网在数字图书馆信息检索中的应用.doc_第4页
第4页 / 共5页
语义网在数字图书馆信息检索中的应用.doc_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

1、1语义网在数字图书馆信息检索中的应用【摘 要】基于字面匹配检索的传统数字图书馆信息检索方法在检索效率方面存在一定的缺陷。新一代语义网在语义理解、信息关联方面有其独特优势,其在数字图书馆信息检索系统中的应用必将大大提高信息检索效率。 【关键词】语义网;数字图书馆;信息组织;信息检索 数字信息资源的海量增长导致了人类信息行为的改变。数字图书馆以其时空的便利性越来越收到人们的重视,人们更多地通过图书馆的信息检索系统来获得所需的资源。但数字图书馆传统的信息检索系统的缺陷也逐渐显现出来。 一、数字图书馆传统信息检索系统存在的问题 目前数字图书馆中搜索引擎多以传统的关键词检索为主。这种检索方式曾在一定程度

2、上满足过用户的需求,但由于字义本身与其概念的延伸经常不在同一级,使得寻得结果往往仅与字面意义相匹配,与人们想得到信息概念及其相关的成分的意愿相违背。首先,传统的检索系统难以准确理解用户的检索需求。如当用户需要查找题名中包含“计算机”的文献时,其真实的检索意图是将关于“计算机” 、 “电脑”等具有同一语义的文献都查找出来。其次,检索系统返回的多篇文章往往只按相关度、实践、被引频次等进行排序,各篇文献之间相互独立,缺乏语义上的联系。 2二、概念语义检索的优势 (一)语义检索系统可以收集用户的相关信息,分析用户的检索行为,了解用户的检索特征与检索爱好,创建符合用户特征的访问模式,从一定程度上提高用户

3、的检索效率。 (二)对用户检索语义的确切理解保证了检索结果的可靠性。概念语义检索克服了字面匹配检索的弊端,使检索结果更接近用户真实的检索需求。 (三)用户可以对系统提供的服务做出信息反馈,对检索结果进行打分排序,系统可根据反馈信息调整服务,从而达到个性化搜索。 三、语义网及其体系结构 1998 年,万维网之父 Tim Berners-Lee 提出“语义网” (Semantic Web)理念。语义网的基本思想是在网络信息的创作和发布中嵌入机器可理解的知识元数据,使计算机具备更强的“理解”和处理数据的能力。语义网环境下,网络成为能理解人类语言的智能网,人机交流变成类似人与人的交流。2000 年 T

4、im Berners-Lee 提出的语义网标准体系结构。该机制的核心由两大模块组成: 以 XML 与 RDF(s)为手段的信息组织模块,用于管理信息,具备部分语义。以 Ontology 为手段的知识组织模块,用于管理知识,提供机器间的语义互操作。标准最底层由统一资源标识符(URI)和统一字符编码(Unicode)构成。语义网标准的第二层由可扩展标记语言(XML) 、域名系统(Namespace)以及可扩展标记语言结构表(XML Schema)构成。第三层由资源描述框架(RDF)和资源描述框架结构表(RDF Schema)构成。 “XML+RDF(s) ”就构成了计算机3间相互理解的基础,它们是

5、改造万维网、建立起语义网信息组织机制的三大核心技术。第五层逻辑(Logic)是在本体层之上要做逻辑推理工作。接下来就是保证信息是可信赖的这两个层次,即论证(Proof)和诚信(Trust) 。 根据以上内容可知,语义网信息组织机制的核心是XML、RDF、Ontology。XML(可扩展标记语言)被誉为“语义标记” ,是一种完全面向数据语义的置标语言。XML Schema 提供了规定 XML 文档结构和内容约束的机制。Namespace 则是解决自定义标记过程中名称冲突问题的。RDF(资源描述框架)是网络资源通用描述框架,它是以三元组:主体谓词客体,来对网络信息资源进行简单描述的。RDF 是一个

6、开放的元数据集成方案。采用 RDF 来处理不同类型元数据集合,可以实现元数据之间的互操作,使计算机可以理解语义。XML 与 RDF 结合解决了信息建立于信息描述的开放机制和系统的开放性,有利于资源的共享。Ontology(本体)在人工智能领域指的是对共享概念模型的明确的形式化规范说明。 四、概念语义检索的实现 (一)概念语义检索的原理。概念语义检索的原理主要分为三个过程:首先,用户向系统输入检索请求,由于用户的知识领域的差异,输入的关键词的准确性有差别,需要系统对检索需求进行语义分析,分析出用户真正的检索需求。第二,概念语义检索系统须对数字对象进行描述和表示,对海量的信息资源进行描述和表示是信

7、息资源数字化整序的过程。第三,语义检索系统将分析出的用户真正的检索意图的认知表达4式与概念语义检索系统中整合后的资源进行匹配,检索出所需的信息资源。 (二)概念语义检索的流程。 (1)创建元数据:收集各学科的数字信息资源,在 MARC、DC 等元数据标准下,利用 XML、RDF 等语义网技术,更准确地描述数字对象的语义,建立元数据并存储在元数据库中。 (2)创建本体知识库:利用元数据库中的信息以及现有的主题词表、语义词典等工具,并且借助领域专家的知识和经验的帮助,构建领域内共同认可的词汇,并从不同层次的形式化模式上给出词汇和词汇间相互关系的明确定义。 (3)语义标引:利用领域本体对文档进行标引

8、。先从文档集中抽取出特征词汇,分析特征词汇,并建立与概念集之间的联系,从而达到使用领域本体对文档进行语义标引。 (4)检索式的处理:用户通过检索界面提交查询请求,推理机利用本体领域内的知识和一些基本的自然语言理解技术对关键词或语句进行分析,从领域本体中抽取出与用户查询关键词或语句具有语义相似度的本体,最终得到用户真正的检索意图。 (5)实施查询并返回结果:推理机将抽取出的语义关键词组成语句群,提交至检索系统。然后,系统从数字图书馆信息资源中搜索出符合该语义词或句的所有相关文献资源,即结果集。 作为下一代互联网,语义网在信息检索方面的优势可以为数字图书馆提高检索效率所借鉴。语义网的和核心技术 XML、RDF、Ontology 为数字图书馆实现用户检索需求的确切理解,构建信息资源的语义关联提供了有效途径,并最终提高了数字图书馆学术信息资源的检全率和检准率。5参考文献 1 罗昊.语义网信息组织机制论纲J.图书情报工作,2005 (7). 2 罗忠凤.集中网络信息资源宏观组织方式的比较J.情报探索,2005(4). 作者简介:田蓉(1989- ) ,女,浙江嵊州人,武汉大学信息管理学院硕士研究生,研究方向:信息资源建设与服务。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 学科论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。