国内外管理元数据研究综述.doc

上传人:da****u 文档编号:1109576 上传时间:2018-12-07 格式:DOC 页数:45 大小:615.50KB
下载 相关 举报
国内外管理元数据研究综述.doc_第1页
第1页 / 共45页
国内外管理元数据研究综述.doc_第2页
第2页 / 共45页
国内外管理元数据研究综述.doc_第3页
第3页 / 共45页
国内外管理元数据研究综述.doc_第4页
第4页 / 共45页
国内外管理元数据研究综述.doc_第5页
第5页 / 共45页
点击查看更多>>
资源描述

1、上海市哲学社会科学规划课题信息资源基础管理性元数据框架研究 调查报告 2018-12-31调查报告:信息资源管理的基本信息撰写者: 信息资源基础管理性元数据框架研究课题组发布日期: 2008-06-06标识符: http:/ 无被替代: 无最新版本: http:/ 推荐稿文件说明: 本文件是信息资源基础管理性元数据框架研究课题的前期调查报告,包括文献调查、问卷调查与现场调查,从多个角度了解国内信息服务机构(主要是图书情报机构)在信息资源管理层面的信息需求以及这些信息需求用元数据形式加以描述的可能性。上海市哲学社会科学规划课题信息资源基础管理性元数据框架研究 调查报告 2018-12-32目次0

2、 前言 .30.1 元数据在信息资源管理层面的重要作用 .30.2 调查的目的 .30.3 调查报告的组织 .3第一部分 .51 管理性元数据研究的起源 .52 管理性元数据的定义与范畴 .63 管理性元数据的原理与应用 .74 代表性的管理性元数据方案 .75 国内管理性元数据的元素设置与规范研究 .106 管理性元数据的发展趋势 .12参考文献 .12第二部分 .141 引言 .142 问卷的设计 .143 调查对象的选择 .154 调查结果综述 .155 调查结果分析 .22附录 .24第三部分 .271 引言 .272 现场调查结果 .273 鸣谢 .32附录 .33上海市哲学社会科学

3、规划课题信息资源基础管理性元数据框架研究 调查报告 2018-12-330 前言0.1 元数据在信息资源管理层面的重要作用利用元数据对信息资源,尤其是数字信息资源,进行开发、利用、管理,已成为信息资源建设的基本手段之一。描述信息资源内容的元数据,即描述性元数据,已受到广泛的关注和深入的研究。遵循标准化、规范化的原则,开发、应用描述性元数据,增进了信息系统的互操作性与开放性,促进了信息资源的无障碍交流。元数据描述信息资源内容的卓越功能激发了人们探索元数据多层次功能的兴趣。人们逐步认识到,元数据除了描述各种类型的信息资源内容,还可以描述信息资源开发、利用、管理过程中其他层次的“数据” 。管理性元数

4、据对信息系统中信息资源的管理政策与机制进行描述,是元数据在信息资源管理层面的拓展。管理性元数据对信息资源采集、加工、利用过程的管理信息加以规范化、开放性的揭示,有助于用户或第三方系统方便地、无障碍地共享本系统的信息资源,有助于各个信息系统在安全机制保障下,通过管理性元数据,有效地交流管理政策与机制,促进不同信息系统之间的互操作性。信息系统的信息资源集合可以通过管理性元数据与具体系统的绑定来形成实际的表达机制,也可以通过修改管理性元数据方便地定制、更改表达机制,还可以支持智能代理对信息资源集合进行自动的搜索与匹配,支持智能代理解析信息资源结构,并在此基础上集成多个信息资源集合。信息系统的管理机制

5、与政策可以通过管理性元数据与具体系统的绑定来形成实际的运行机制,也可以通过修改管理性元数据方便地定制、更改管理机制与政策,还可以支持智能代理对管理政策和规则进行自动的搜索、解析与相应的处理。0.2 调查的目的本课题通过文献调查、问卷调查与现场调查,从多个角度了解国内信息服务机构(主要是图书情报机构)在信息资源管理层面的信息需求以及这些信息需求用元数据形式加以描述的可能性。文献调查以广泛搜集国内外管理性元数据的研究动态与相应的元数据方案为基点,着重分析管理性元数据研究的侧重点,了解当前人们对管理性元数据的关注点以及管理性元数据研究的空白点。问卷调查以有代表性的国内图书情报机构为调查对象,以填写问

6、卷调查表的形式,了解国内主要的信息服务机构在信息资源生命周期的三个基本阶段采集、加工、服务的管理信息需求。现场调查在文献调查的基础上,以一个典型的图书情报机构为解剖对象,通过实地调查,分析信息资源采集、加工、服务的基本业务流程,提炼基本的管理信息元素。0.3 调查报告的组织本报告分三大部分:文献调查、问卷调查、现场调查。文献调查包括 6 部分:管理性元数据研究的起源、管理性元数据的定义与范畴、管理性元数据的原理与应用、代表性的管理性元数据方案、国内管理性元数据的元素设置与规范研究、管理性元数据的发展趋势。问卷调查包括 5 部分:引言、问卷的设计、调查对象的选择、调查结果综述、调查结果分析。调查

7、结果综述又分成 5 部分:项目得分与百分比、子项目得分与百分比、有疑问的项目与子项目、提议增加的项目与子项目、与管理信息有关的业务背景调查。上海市哲学社会科学规划课题信息资源基础管理性元数据框架研究 调查报告 2018-12-34现场调查包括 2 部分:引言、现场调查结果。现场调查结果又分成 4 部分:调查目的与方法、组织机构、调查环节、各环节业务工作概况与流程。各环节业务工作概况与流程分别从信息资源采集、加工、服务三方面陈述了基本的业务工作及其流程,提取了相应的管理信息元素。上海市哲学社会科学规划课题信息资源基础管理性元数据框架研究 调查报告 2018-12-35第一部分文献调查:国内外管理

8、性元数据研究综述对元数据的研究,是伴随人们对信息资源进行有效整理、标识、描述、发现、利用及管理的需求而发展起来的。近年来,关于元数据的研究越来越广泛和深入,依据功能区分的不同元数据类型渐次受到众多领域学者的关注。管理性元数据(又称管理元数据、管理型元数据、管理性后设资料)是继描述性元数据、结构性元数据、保存元数据之后又一被关注的研究对象。虽然管理性元数据与保存元数据关系十分密切,有的研究者甚至将保存元数据也归入管理性元数据的范畴,但一方面这种观点在学界并没有达成共识,另一方面保存元数据本身已形成了专门的研究局面,因此不在本文的综述范围内。管理性元数据是种应用性极强的元数据类型,其研究起源于国外

9、。从研究成果来看,国外比较注重针对不同领域、流程或应用的管理性元数据方案的研制。国内多为对国外研究成果的译介与分析,主要表现为三种形态:一种是综合性元数据研究文献中对管理性元数据的介绍,主要关乎管理性元数据的界定与范畴;一种是针对管理性元数据的专门研究,此类多为译介性文献,解析某几种国外的管理性元数据方案及其应用,或者是通过借鉴国外管理性元数据研究,比较系统地阐述管理性元数据的原理与应用;另外一种是数字系统基于实际需要制订元数据方案时定义了一些管理性元数据,以实现有效的资源管理。基于此,国内外管理性元数据研究形成了各自的特色:国外的研究成果多表现为成型的管理性元数据方案;而国内主要以管理性元数

10、据的理论解析为主。本文将融合这两种研究倾向,从发展起源、定义与范畴、原理与应用、有代表性的方案以及国内的研究借鉴等几方面来综述国内外管理性元数据的研究状况。1 管理性元数据研究的起源国外管理性元数据的研究始于 20 世纪末,那时研究人员已经意识到在描述性元数据应用的基础上开展管理性元数据的研究,将促进信息系统在管理层面上的互操作性与开放性,促进信息资源在管理层面的交流与共享。美国国会图书馆在 1998 年发起制订的“数字仓储开发核心元数据元素” (Digital Repository Development Core Metadata Elements)中列出了管理性元数据、结构性元数据与描述

11、性元数据三类元数据 1。此后的“元数据编码与传输标准” (Metadata Encoding and Transmission Standard, METS)就继承了这一元数据分类架构,并把管理性元数据明确地划分为技术元数据、知识产权元数据、来源元数据与数字化过程元数据。1999 年 Debbie Campbell 和 Renato Iannella 发表了 A-Core(Administrative 上海市哲学社会科学规划课题信息资源基础管理性元数据框架研究 调查报告 2018-12-36Container of Metadata)草案 2。2000 年 10 月 4 日第 8 届国际都柏林

12、核心元数据先导计划研讨会(8th International Dublin Core Metadata Initiative Workshop,DC-8) 在加拿大渥太华召开,第一天即设立了“管理性元数据(Administrative Metadata) ”分会场 3。同年 10 月DCMI 都柏林核心元数据先导计划(Dublin Core Metadata Initiative)成立了专门的管理性元数据研究工作组(DCMI Administrative Metadata Working Group) ,并于 2003 年 10 月正式发表了研究成果Dublin Core 管理性元数据元素集,

13、即 Administrative Components(简称 AC,Admin core 或 A-core) 4。DCMI 对于管理性元数据的高度重视引起了国际上的广泛关注。自 20 世纪末至今,国际上针对管理性元数据的研究和应用一直都没有停止。学者们对于管理性元数据理论问题的研究在逐步地深入,并越来越贴近其本质;在具体的管理性元数据方案研制方面也取得了不少成果。2 管理性元数据的定义与范畴对管理性元数据的界定,目前基本可以概括为四种类型:(1) 维护和管理信息资源的元数据。1998 年美国 Getty 信息研究所(Getty Information Institute)关于元数据研究的专著中

14、,Anne J. Gilliland-Swetland 将管理性元数据界定为“在管理信息资源中利用的元数据” ,实例有采购信息、权利和复制品追踪、法定检索所要求的文献、位置信息、用于数字化的挑选标准、版本控制 5。国内吴开华则认为用以维护和管理资源的数据通常被称为管理性元数据,一般包括创建者元数据、存取权限元数据、数据处理技术的元数据 6;(2) 管理元数据的数据。AC 对于管理性元数据的界定即代表了此种观点 7:管理性元数据是关于元数据的元数据,这种元数据主要面向系统管理和维护人员,是对元数据记录进行管理和维护的必要途径,一般要求能够较完整地反映和记录涉及元数据记录的标识、重要操作及其他时间

15、、责任人、状态、权限管理等信息。国内牛金芳关于 AC 的介绍亦反映了这种界定 8;(3) 依据 METS 对元数据的分类,将技术元数据、知识产权元数据、来源元数据、数字化过程元数据统称为管理性元数据 9;(4) 从系统原理的角度来界定管理性元数据,此方面国内张晓林的研究团队作了较深入的研究。其研究认为管理性元数据的实质是对信息系统管理机制的规范、开放描述;管理机制可以表现为资源选择评价、质量控制、资源集成、资源调度、知识组织、使用控制、个性化定制、版权管理、隐私保护、资源长期保存、流程控制、系统互操作管理等方面 10。从以上观点来看,目前对于管理性元数据并未形成清晰的界定;已有的定义主要是通过

16、其涵括范围来说明,而这个范围又是相当地宽泛,涉及内容元数据、资源及系统管理的不同应用层面。上海市哲学社会科学规划课题信息资源基础管理性元数据框架研究 调查报告 2018-12-373 管理性元数据的原理与应用谈及管理性元数据的原理与应用,一般会涉及管理词汇集、管理政策或规则的描述语言、互操作、管理性元数据在数字图书馆的应用等问题。在这方面阐述得比较系统深入的,当属国内张晓林的研究团队。其研究认为管理性元数据的实质是对信息系统管理机制的规范、开放描述;管理机制是根据特定的本地化和个性化应用场景对裸对象进行选择、组织、解释和表现以形成特定服务的系统方法与过程集合 11。关于管理性元数据的应用,该研

17、究认为需要以下工具:(1) 关于特定管理需求的管理词汇集,用于描述管理问题所涉及的实体、实体关系、过程和规则,最典型的是 INDECS 元数据词典;(2) 关于特定管理政策或规则的描述语言,如 PICS、XACL、ODRL、XRML、P3P 等管理政策描述语言;(3) 管理性元数据的组织与传递机制,例如管理性元数据文件结构和这些文件的发布、传递与调用要求。同时该研究从服务系统及用户需求两个角度构建了管理性元数据的应用框架,并指出管理性元数据在数字图书馆的应用问题。另有部分文献通过对国外某些管理性元数据的译介,来阐述其原理与应用。曾婷等关于权限元数据的研究认为权限元数据涉及两个方面;权限表达语言

18、和权限数据字典 12。权限表达语言只有语法没有语义,它采用权限数据字典中定义的词汇来表达权限和许可,依靠权限数据字典中词汇的定义进行权限表达的解释。权限元数据的扩展主要是通过权限数据字典中元素的增加来实现,而非改变权限表达语言本身。据此原理,作者进而对包括权限元数据两方面的 ODRL、XrML 方案,及侧重于权限数据字典的2rdd 模型进行了解析,并探讨了权限元数据的互操作问题。蒋颖认为数字权限管理性元数据是以计算机可识别的标准格式来描述生产者和信息服务系统的权限管理政策,其核心部分是开放式权限描述语言(Rights Expression Language, REL) 13。REL 所表达的权

19、限内容有三层含义:版权、合同和控制,即描述和表达版权、合同及许可协议,并对访问和使用进行控制。作者介绍了两种较具影响的权限表达元数据 ODRL 及 MPEG-21/5, 并分析了数字权限管理性元数据在数字图书馆中的应用。4 代表性的管理性元数据方案目前比较有代表性的管理性元数据方案皆源自于国外。由于研究机构及其研究计划之间缺乏协调,国外现有管理性元数据集种类繁杂,且分散于不同领域或不同的管理层面,按照其描述和标记对象的不同,可以大略分为以下几类:4.1 描述资源或资源集合的管理性元数据对资源或资源集合及其管理与使用机制进行描述,这里的资源除了资源内容本身之外,也包括描述资源内容的元数据。例如可

20、扩展的核心元素集 AC、 丹麦的 DEF 元数据规范、ERMI 数据元字典、PICS 规范等。上海市哲学社会科学规划课题信息资源基础管理性元数据框架研究 调查报告 2018-12-384.1.1 AC 管理性元数据(AC-Administrative Components)AC 管理性元数据是对描述资源内容的描述性元数据进行有效管理的元数据 13。2003年 10 月以都柏林核心元数据先导计划管理性元数据工作组的名义公布了它的最终版本,2006 年进行了更新。AC 是附属性的元数据,不能单独使用,必须同至少一种其它的内容元数据集联合使用。AC 和内容元数据的联合使用与其它各种元数据的互操作一样

21、可以通过 RDF/XML 来实现。 AC 和 DC 一样也是一个核心集,可以为满足特定需要进行扩展。设置了三类元素,即有关整条元数据记录的元素、描述记录更新和变动的元素、有关在系统之间交换数据的元素。采用 XML Schema 编码。4.1.2 DEF 元数据规范(Denmarks Electronic Research Library metadata description)DEF 元数据规范用于电子资源门户网站丹麦电子研究图书馆(Denmarks Electronic Research Library, DEF)的元数据收割管理。丹麦编目中心(The Danish Bibliograph

22、ic Centre)在对网络信息资源进行编目的时候发现,除了需要利用 DC 元素集以外,还需要定义新的元数据对编目记录进行管理。针对这种需求,丹麦编目中心制定了丹麦电子研究图书馆管理性元数据,简称 DEF 管理性元数据 15。设置了 11 个元素,即:记录创建日期、记录最后修改日期、主题门户标识(PID) 、链接采集者 email、记录创建者email、记录创建者、记录修改者、资源通告、记录创建者注释、收割选择、记录状态。4.1.3 ERMI 数据元字典(Electronic Resources Management Initiative data element dictionary)电子资

23、源管理方案(Electronic Resources Management Initiative, EMRI)由数字图书馆联盟(Digital Library Federation,DLF)发起,创意源于华盛顿大学的 Tim Jewell。2001年 Jewell 发表了关于 “图书馆如何管理电子资源”的报告。随后,DLF 联合多家图书馆和机构致力于这一问题的解决。直到 2004 年 8 月,DLF 发表了其研究报告,从而为开发电子资源管理系统(Electronic Resources Management System,ERMS )奠定了基础 16。该报告列举了研发 ERMS 的三大要素:系

24、统功能需求分析、ERMS 数据库的实体关系图和数据元字典。数据元字典详尽罗列了电子资源采集、加工、使用的管理过程中涉及的数据元(即元数据元素) 。目前许多市售电子资源管理系统都是在 ERMI 的基础上开发的。4.1.4 PICS 资源评鉴元数据规范(Platform for Internet Content Selection, PICS)万维网联盟(WWW Consortia)定义了互联网内容选择平台(Platform for Internet Content Selection, PICS)规范,提供了评鉴元数据的应用模式和标记语言。该规范制定的初衷是为了帮助老师和家长控制儿童上网,但它兼

25、具的资源评鉴功能使其成为重要的网络资源评鉴元数据 17。PICS 主要包括评鉴标签体系文件和评鉴标签文件。评鉴标签体系文件描述评鉴机构建立的评鉴指标体系,定义了评鉴体系(ratingSystem) 、评鉴机构(ratingService ) 、扩展信息(extension) 、名称(name) 、描述( description) 、评鉴类别(category)等元素;评鉴标签文件描述评鉴者依据评鉴指标体系对资源所作的评鉴信息,包含评鉴机构 URL(service URL) 、评鉴选项(labels)和评鉴标签(ratings) 。采用XML/RDF 编码。上海市哲学社会科学规划课题信息资源基础

26、管理性元数据框架研究 调查报告 2018-12-394.2 描述业务流程的管理性元数据对业务操作过程及其相关实体和相关操作条件等进行描述,例如 ERTS 三校协会电子资源追踪系统管理性元数据, 佛罗里达海岸大学图书馆 Tango 管理性元数据等。4.2.1 ERTS 三校协会电子资源追踪系统管理性元数据ERTS( The Tri-College Consortiums Electronic Resources Tracking System)是一个收集和管理美国 Bryn Mawr、 Haverford 和 Swarthmore 三校共同购买的电子信息资源的数据库系统,该系统建立在管理性元数据

27、基础上。该系统为三校馆际互借专家、参考咨询馆员和院系领导获取电子信息资源提供了在线入口,它依托管理性元数据具有身份认证、资源鉴定、技术关联以及统计等功能 18。ERTS 管理性元数据集包括以下几个对象:Licensors(资源认证实体) ,Items(独立资源名称) ,Purchases(资源获取)和Vendors(资源的出售者 ) 。4.2.2 佛罗里达海岸大学图书馆 Tango 管理性元数据佛罗里达海岸大学图书馆(Florida Gulf Coast University Library)通过 Tango 系统将管理性元数据与流通服务、馆际互借服务以及特色资源服务结合起来,实现了图书馆服务

28、网络自动化。该馆将管理性元数据应用于图书馆管理的许多方面,例如资源建设、馆际互借及文献传递评估。在课程服务(course reserves)中,为了保护著作权,元数据还用于跟踪每学期使用的每种文献 19。4.3 描述系统功能的元数据语言对资源或服务系统的接入条件、界面和输入输出要求等进行描述,形成特定的管理政策或规则描述语言,例如 P3P(Platform for Privacy Preferences)隐私保护政策元数据、XACL(XML Access Control Language)用户使用控制元数据、ODRL 知识产权管理性元数据(Open Digital Rights Languag

29、e)等。4.3.1 P3P 隐私保护政策元数据(Platform for Privacy Preference, P3P)隐私偏好设定平台(Platform for Privacy Preference, P3P)作为隐私保护政策元数据,其目的是明确描述某个系统采集用户数据时的有关政策,以便用户判断这个政策是否符合自己的要求。它由万维网联盟(WWW Consortia)的 P3P 工作组制订,最新版本为 2006年 11 月颁布的 1.1 版。P3P 考虑的资源对象包括网站、网站目录区、网页、网站集合,也可以是网站上的特定服务(例如 cookie 请求、购物车记录、检索行为追踪等) ,当用户进

30、入特定资源或服务时,用户代理可查询相应的 P3P 政策文件,并向用户提出建议或警告。P3P 管理性元数据集包括四个部分:用户元数据、第三方元数据、商业元数据和动态元数据。通常第三方数据由用户或者商家提供,以利于第三方信息的交换,例如当系统需要提供某人的配偶信息或者商业伙伴信息的时候。第三方元数据的定义与用户元数据相同 20。1.1 版采用 XML Schema 编码。4.3.2 XACL 用户使用控制元数据(XML Access Control Language, XACL)可扩展访问控制标记语言(XML Access Control Language, XACL)通过使用控制政策,上海市哲学

31、社会科学规划课题信息资源基础管理性元数据框架研究 调查报告 2018-12-310对用户使用资源的请求,实施身份认证、使用授权等管理,支持异构系统在服务层的互操作 21。它由 IBM 公司于 2000 年制订,2003 年采纳为国际标准。XACL 模式包含主体(subject ) 、对象(object ) 、行为(action) 、条件(condition )等实体。主体是用户或其代理,他在满足一定的条件时,可对资源对象实施读、写、修改、转换等行为。XACL 语言描述控制用户访问资源的政策文件、用户请求以及处理器分析形成的使用权限审查决定和冲突解决方式等信息。采用 XML 编码。XACL 不再

32、更新,其内容包含于新制订的 XACML 语言 (Extensible Access Control Markup Language)22。XACML 语言于 2003 年 2 月批准为结构化信息标准促进组织(Organization for the Advancement of Structured Information Standards, OASIS)标准。它同样是基于 XML 的用户使用控制元数据,包括定义访问控制需求的策略语言和描述资源运行请求的访问决策语言。当确定了保护资源的策略后,XACML 函数会将请求中的属性与策略规则中的属性进行比较,生成一个许可或拒绝决策。定义策略的高层元

33、素包括Policy(政策)元素,Policy 又包含 Target、Rule 、Obligation 等元素以及相关属性。4.3.3 ODRL 知识产权管理性元数据(Open Digital Rights Language, ODRL)开放数字权益语言(Open Digital Rights Language, ODRL)是由国际版权组织提出的有效开展数字资源权益管理的开放标准 23。最新版本是 2002 年 8 月颁布的 1.1 版。ODRL 模型定义了用户(party) 、协议(agreement) 、数字对象(asset) 、权益(rights) 、权益拥有者(rights holder

34、) 、条件(condition)等对象及其关系;ODRL 语言对包含使用限制、权益拥有者在内的数字权益进行描述。采用 XML 编码。5 国内管理性元数据的元素设置与规范研究尽管国外关于管理性元数据的研究与应用零散分布在不同的领域,但已基本涉及数字图书馆的不同层面,包括电子资源建设、信息服务、用户控制等。国内目前并没有研发出成型的管理性元数据方案,仅是某些数字系统根据自身需要并参考国外已有方案,在制订元数据规范时设置一些管理性元素或模块。北京大学数字图书馆中文元数据标准框架提出的管理性元数据借鉴自 OAIS 的分类机制,主要由 4 方面元素组成:上下文信息(context information

35、) , 指对象内容信息同所在环境的关系,包括创建内容的理由、与其它相关资源对象的关系; 出处信息(provenance information) , 指数字对象的历史,包括出处(如原始技术) 、环境变更历史、保管历史等;验证信息(fixity information) , 提供验证机制; 评价信息( remark/comments) , 用户对现有元数据的元素项内容进行修改、建议或评述 24。清华大学建筑数字图书馆元数据体系 THADL1.0 中设有 management 元素,包括信息有:记录编制机构、主要创编者、数字化资源制作、资料整理、内容标引(元数据记录的创建者) 、标引指导(对元数据记录的创建进行指导的人) 、数据审核(对元数据记录进行审校的人) 、质量控制(最终保证元数据记录正确性的人) 25。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 实用文档资料库 > 公文范文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。