1、1基于 XML 语言的图书馆共享数字资源存储的实现摘 要 图书馆共享数字资源的检索和存储是图书馆数字资源建设的重点。在云存储模式下,如何有效管理庞大的数字资源,尽快有效检索到所需资源,减少资源共享中的重复存储?提出一种基于 XML 语言的数字资源存储格式,这将使得对已经存在的书籍资料的整序和应用变得较为简单,方便检索,在共享资源存储时具有一定优势。 关键词 数字资源;XML 语言;图书馆 中图分类号:TP312 文献标识码:B 文章编号:1671-489X(2013)09-0069-02 Design of XML-based Shared Library Digital Resources
2、Storage/Tang Wenling, Li Chunyan Abstract Retrieval and storage of the shared library digital resources is the focus of the construction of the library digital resources. Based on cloud storage mode, how to manage a huge digital resources effectively, retrieved as soon as possible, and reduce duplic
3、ate resource storage, this paper propose a storage format based on the XML language, which will make the books already exist collation of information and applications become more simple, convenient retrieval, has certain advantages in shared resource storage. 2Key words digital resources; XML; libra
4、ry 1 前言 高校图书馆在高校信息化建设中发挥着重要作用。随着图书馆信息量的剧增和“数字化文献”载体形态的迅猛发展,图书馆必须开始运用起数字化技术贮存和传递文献信息。当今大部分高校图书馆都实现了资源数字化,但因开发软件不同,在运用时会针对不同的格式要求下载不同的阅读软件,给读者带来一定的不便。存储的格式也各种各样,使检索资源的有效性降低。各高校图书馆资源建设存在大量的重复,如今信息化社会步入云时代,高校图书馆资源共享已经成为图书馆发展的大趋势,如何实现图书馆资源的共享和减少数字资源开发的重复?基于 XML语言的图书馆共享数字资源存储格式的开发将为解决上述问题提供参考。2 XML 的特点 XM
5、L(Extensible Markup Language) ,意为“可扩展标记语言” ,是用于标记电子文件使其具有结构性的标记语言。 2.1 简单 XML 仅仅是存储数据。事实上 XML 与其他数据表现形式最大的不同是:它极其简单。通过 XML 可以用纯文本文件来存储数据,它可以用来在文件或数据库中存储数据。 XML 在数据的交换、存储和共享方面有着独特的优势。现在市面上的数据库种类繁多,虽然数据库之间大多可以相互转换,但是它们并不兼容,搜索多样的不兼容数据库更是无法实现的。但是 XML 可以将不同来3源的结构化数据很容易地结合在一起,后台数据库和其他应用得来的数据就能够在中间层的服务器上进行
6、集成了。 2.2 易于结合 XML 的简单使其易于在任何应用程序中读写数据,这使 XML 很快成为数据交换的唯一公共语言,意味着程序可以更容易地与 Windows、Mac OS、Linux 以及其他平台下产生的信息结合,然后可以很容易加载 XML 数据到程序中并分析,以 XML 格式输出结果。 2.3 灵活 XML 保留了 SGML(标准通用标记语言)的结构化功能,这样就使得设计者可以定义自己的文档类型。XML 同时推出一种新型文档类型,开发者可以不必定义文档类型,这使得 XML 极其灵活。 3 设计方式 3.1 XML 文档处理 在图书馆检索系统中(以北京邮电大学图书馆为例) ,检索要素包括
7、题名、出版社、索书号、作者、标准号(ISBN) 、主题词、图书条码、分类号、题名缩写,这些基本上也就是一本图书在检索时会用到的全部要素,当然不同的图书馆检索系统中要素可能不完全相同,检索要素还可以包括出版时间、字数等。 以北京邮电大学图书馆检索系统中用到的图书要素为例,一本图书的 DTD 定义如下: 4这个 DTD 完整地表述了一本图书所包含的主要信息:题名及缩写、一个或多个作者、索书号、出版社名字及出版时间、ISBN 标准号、主题词(关键字) 、图书条码、中图分类号。作者后面的“+表示至少应有一个作者,主题词及关键字后的“?”表明可以省略,#PCDATA 表示为字符串型。 由于图书检索系统与
8、论文期刊检索系统一般是独立的,所以论文期刊的 DTD 也可另行设计,实际上与图书的 DTD 大同小异,但在元素设置上略有不同。期刊论文的检索要素更多,以知网中国期刊全文数据库检索项为例,除了图书的这些要素外,还包括关键词、摘要、刊名、参考文献、基金、ISSN 等。 一个论文期刊的 DTD 可以设置为: 53.2 显示 当需要将图书格式化输出显示在屏幕上时,就要将 XML 文档变换为HTML 文档,可采用 XSLT 将 XML 文档格式化显示。XSLT 是扩展样式表转换语言(Extensible Stylesheet Language Transformations)的简称,这是一种对 XML
9、文档进行转化的语言。 大部分软件如 FrameMaker、Microsoft Office 中的 MS Word、Excel等都支持 XML,所以 XML 文件转换为其他格式文件也相当方便。 4 基于 XML 存储方式的优势 4.1 扩展方便 对于不同高校图书馆图书要素定义不同的情况,或是图书本身要素不全的情况,此格式扩展非常方便。例如:若有出版时间这个要素,将其作为 press 的子元素 date 并标记为可以省略,这样有些图书有出版时间这个要素,有些出版时间不明的则可以省略。在此 DTD 基础上,可以加入其他各要素,方便管理及查询。 4.2 在共享资源时减少重复存储 相关图书馆间可构建共享
10、空间,将数字资源放于存储资源层,用户只需将电子设备连接至互联网,就可访问和获取所需的任何数据。在实现共享资源时,会因为重复资源而浪费大量存储空间。DTD 中有一项owner 元素表明了此资源的拥有者, “+”表示至少有一个拥有者。 增加此元素后,若发现有重复资源,将资源拥有者都加入此表项后,重复资源即可删除,为存储更多其他资源做准备。资源拥有者为各大高6校图书馆,可以用各高校缩写或是更为简洁的标号来表示。 4.3 兼容性好 随着云计算技术的发展,云存储模式下图书馆数字资源的建设成为当今热门讨论话题。在云存储模式中,当用户提交一个查询请求时,云存储的管理系统将调用云中的所有服务器和存储设备同时搜
11、索众多的数据库,然后将结果返回给用户。另外,除了使用 PC 外,用户还可以通过PDA、手机等终端方便、快捷地获得云存储中的相关信息和服务,无需考虑使用的是哪个数据库、哪个存储设备。 而 XML 满足了两个基本的需求:将数据和表达形式分离;在不同的应用之间传输数据。 5 结束语 基于 XML 的存储方式能更好地帮助各高校实现共享资源,不仅方便大家交流和查找资料,而且能实现资源高效利用,减少资源浪费现象。 参考文献 1曾祥文.云存储模式下图书馆数字资源建设J.软件导刊,2011(12):165-167. 2刘姝.对高校图书馆建设数字资源存储系统的思考J.大学图书馆学报,2008(6):75-78. 3邵泳兵.基于 XML 的考试系统的设计J.中国科技信息,2006(5):86-87.