1、1数字文化资源的元数据格式分析摘要元数据可以实现对庞大数字文化资源的描述、管理和有效检索。本文首先介绍了数字文化资源的特点和应用中对元数据的实际需求,并重点分析了数字文化资源的元数据格式。之后,通过对目前国内外已有元数据格式的分析和归纳,本文提出了以 VRA Core(Visual Resources Association)作为核心格式,CDWA(The Categories for Description of Works of Art)部分元素作为扩展元素的数字文化资源的元数据格式。最后通过实例来分析所提出元数据格式在数字文化资源应用中的可行性。 关键词数字文化资源;元数据;VAR Co
2、re;CDWA 中图分类号TP311.13文献标识码A文章编号1008-0821(2013)08-0061-04 文化资源是人类在社会发展过程中创造并借以进一步从事文化生产和文化活动的物质成果和精神成果的总和。广义的文化资源难以给出具体的界定,只要能体现人类追求和满足人类精神需求的产品或活动,都应属于文化资源的范畴。我国历史悠久,民族风俗各异,民俗风情资源相当丰富,同时目前各文化领域也不断涌现出各种各样的文化资源,为了保护与保存、传承、传播、交流共享这些文化资源,我们需要对文化资源进行数字化处理。 文化资源种类繁多、数据庞大,而且增长速度也非常快,为了方便2确认、检索、管理这些文化资源,人们提
3、出了数字文化资源的元数据概念。所谓元数据,是描述数据的数据或信息的信息。元数据的使用领域非常广泛,不同领域(甚至同一领域)往往存在着多个不同的元数据格式。在数字文化资源领域中,元数据格式的选择不仅要根据其数据特点和应用需要,同时还需要尽量考虑元数据格式的兼容性以及后续的可扩展性。首先本文将介绍一些相关概念,并总结归纳几种经典的元数据格式,其次分析合适数字文化资源的元数据格式并以一实例分析其可行性,最后对本文进行总结和展望。 1 元数据与数字文化资源 1.1 元数据简介 元数据是“用来描述数字化信息资源并确保这些数字化信息资源能够被计算机自动辨析、分解、提取和分析归纳的一种框架或一套编码体系”1
4、。在不同的领域元数据的具体定义不尽相同。在图书馆与信息界,元数据被定义为“提供关于信息资源或数据的一种结构化的数据,是对信息资源的结构化的描述”2。但它的本质则是描述数据的数据(data about data) ,它是信息共享和交换的基础和前提。元数据的使用目的在于:(1)识别资源;(2)评价资源;(3)跟踪资源;(4)实现信息资源的保存与保护、发现、查找以及对信息资源的有效管理等。 元数据格式涉及的内容有元数据内容格式、元数据应用规范和元数据格式语言3。其中元数据内容格式一般由标题、创作者、主题、日期等元素或其子元素组成。而应用规范是应用系统在使用元数据格式进行实际描述数据时的具体规范,涉及
5、元素选择方式,元素内容详细界定,3内容描述方式等内容。所谓元数据格式语言,是指定义、标记、封装、交换传递元数据时所用到的语言。目前在不同领域和不同应用项目中已存在多种不同的元数据格式。 元数据的应用范围非常广,Susanne Boll 等专家认为元数据可应用于图像、声频和视频的检索和导航,结构化的文献管理,地理和环境信息系统,数字图书馆,混合多媒体等4。随着数字化信息的发展,元数据也正在被用于数字图书馆、医学信息资源等更多的领域中。 1.2 数字文化资源简介 数字文化资源是文化资源数字化后的产物。文化资源的数字化是利用数字技术对文化资源进行加工处理。数字文化资源的时效性强,并且不受时间、地域的
6、限制。文化资源种类众多,分类方式也很多。一般意义上的数字文化资源非常广泛,目前国际上还未形成可用数字文化资源描述的统一元数据格式。针对不同种类的数字文化资源形成适合该种类的数字文化资源的元数据格式更具现实意义。 数字文化资源的元数据格式是根据其数据特点和应用需求而确定的。在数字文化资源领域,元数据主要用于对数字文化资源的管理、保护与长期保存、描述、确认和检索、知识产权的辨认、跟踪和管理等。因此数字文化资源的元数据除了具有其他一般元数据的元素外(比如主题、创作者、来源等) ,还应元数据内容上体现技术、材料、位置、风格/时期等元素。此外,在功能上一定要满足著录描述、确认和检索、保护与保存、管理。
7、2 元数据格式分析 4随着元数据重要性日益突出,许多国家、国际学术团体和公司都在研究制定与其密切相关的元数据格式。下面将介绍几种目前国内外比较经典的元数据格式。 2.1 国外常用的几种元数据格式 2.1.1DC 都柏林核心元数据(Dublin Core,DC)5是由计算机专家、网络专家和图书馆专家等人员所组成的一个非正式小组于 1995 年在美国俄亥俄州都柏林开发的元数据元素集。DC 由 15 个基本元素组成,包括标题、创作者、主题、摘要等。DC 简单易用,并主要用于网络资源的著录和发现。随着 DC 的发展,DC 与其它多种元数据格式建立了映射关系,通常还被作为各种元数据格式转换的媒介。DC
8、元数据应用于各学科各领域,如澳大利亚政府定位器服务,丹麦国家图书馆等。 2.2.2 中国科学院科学数据库核心元数据格式 中国科学院科学数据库核心元数据格式是由中国科学院计算机网络信息中心主持,联合中科院各单位共同研究制定,主要用于科学数据库资源的建设、管理、共享和服务等7。其元数据由数据集元数据、服务元数据两部分组成。该元数据格式是开放式的,用户可基于该方案开发满足特定需求的元数据。 3 元数据与数字文化资源 4 结论 我国的文化资源非常丰富且增长迅速,对文化资源的数字化处理可以在很大程度上解决资源保护、传承、交流共享等问题。本文首先分析5了数字文化资源的特点和应用需求,并对目前国内外已有的元
9、数据格式进行分析和归纳,提出了一种以 VRA Core 作为核心格式,CDWA 中部分元素作为扩展元素的元数据格式,并以一个雕像作品为例,多个不同元素从不同角度对雕塑内容、知识产权、文化特点等方面进行详细介绍。我们可以根据这些元素来描述、确定和检索、保护与长期保存和管理数字文化资源。 本文目前只是考虑数字文化资源的应用特点,及数字文化资源元数据定义与目前已有元数据格式的兼容性,但随着应用的展开,部分格式还需要进一步完善,如核心元素是否需要扩展,核心子元素的确定等。在后续工作中,我们要对所提格式进行完善修改,同时还应考虑元数据格式的兼容性及后续的扩展性等问题。 参考文献 1徐久龄,肖慧玲.元数据
10、的研究J.信息系统,2003, (2):163-166. 2赵慧勤.网络信息资源组织元数据J.现代图书情报技术,2000, (1):102-105. 3张晓林.元数据研究与应用M.北京:北京图书馆出版社,2002. 4刘嘉.元数据导论M.北京:华艺出版社,2002. 5张敏,张晓林.元数据(Metadata)的发展和相关格式J.四川图书馆学报,2000, (2):63-70. 6冯项云,肖珑,廖三三,等.国外常用元数据标准比较研究J.大学图书馆学报,2001, (4):15-21. 67陈彩红.国内外元数据格式宏观比较研究J.河北科技图苑,2011,24(1):65-67. 8中国国家图书馆.中文元数据方案R.2002. (本文责任编辑:孙国雷)