1、数字图书馆标准规范建设与应用北京交通大学图书馆张 彦2008年4月,开放环境下的数字图书馆数字图书馆标准规范的建设框架数字图书馆内容创建的标准规范数字图书馆对象描述的标准规范数字图书馆信息服务与管理的标准规范,目录,1.开放环境下的数字图书馆,1.1 我们所面临的环境用户角度:以用户为中心的信息环境信息环境:多元、关联、交互的数字信息过程信息服务:基于馆藏、基于集成、基于用户,1.开放环境下的数字图书馆,1.2 我们所遇到的问题处于分布、异构和动态变化的信息资源和服务环境中必须能够被用户在复杂的网络环境下方便利用能被第三方系统方便利用,能够方便利用第三方系统,1.开放环境下的数字图书馆,1.3
2、 我们要做的:可使用性、互操作性、可持续性可使用性:资源和服务能够在网络环境和复杂的技术条件下被用户方便的使用互操作性:在网络环境上与其它系统进行信息交换功能、组合; 服务集成;流程协同的能力可持续性:在变化的环境下长期使用的能力,1.开放环境下的数字图书馆,遵循开放标准规范是数字图书馆建设的基本原则。这不是技术选择的自由而是对用户和历史的责任,目录,开放环境下的数字图书馆数字图书馆标准规范的建设框架数字图书馆内容创建的标准规范数字图书馆对象描述的标准规范数字图书馆信息服务与管理的标准规范,2.数字图书馆标准规范建设框架,实施指南,建设规范,加工规范,标识规范,基本元数据,专门元数据,检索规范
3、,资源集合元数据,核心标准规范体系,发展战略,建设机制,高层元数据规范预研,元数据等级系统,开放发展机制,目录,开放环境下的数字图书馆数字图书馆标准规范的建设框架数字图书馆内容创建的标准规范数字图书馆对象描述的标准规范数字图书馆信息服务与管理的标准规范,3.数字图书馆内容创建的标准规范,3.1数字内容加工过程的标准规范 前加工过程、加工的内容标准、加工过程规范、后加工过程3.2内容编码标准规范 内容编码、格式组织、内容标识、复合对象格式3.3格式标准规范 格式体系,文本,图像,视频,音频等3.4数字对象标识规范 唯一标示符命名体系,优先采用URI或者Info命名域,图书期刊论文集:推荐标准-最
4、低标准报纸海报年画剪纸:推荐标准-最低标准古籍(善本家谱方志):推荐标准-最低标准手稿乐谱草图:推荐标准照相缩微胶片:推荐标准音频资料:推荐标准-保存、应用视频资料:最低标准-保存,目录,开放环境下的数字图书馆数字图书馆标准规范的建设框架数字图书馆内容创建的标准规范数字图书馆对象描述的标准规范数字图书馆信息服务与管理的标准规范,4.数字图书馆对象描述的标准规范,4.1 基本元数据标准4.2 基本元数据扩展标准、基本元数据应用规范4.3 专门元数据,4.1 基本元数据标准,元数据:对信息资源进行结构化描述的数据,用来规定数字化信息的组织和描述规则的一种数据结构标准。元数据的内涵:由语义、内容标准
5、和句法三部分构成。,元数据的基本概念,4.1 基本元数据标准,元素定义说明定义:对元素概念与内涵说明数据类型:元数据值所表现的数据类型频次范围:元素识用频次范围0,)注释:关于元素或者应用的其他说明,基本元数据核心集(15个元素),名称:名称标签:title统一资源定位符:http:/ 基本元数据扩展标准,4.2.1 术语概念4.2.2 扩展集元素定义规则4.2.3 扩展集的组成结构*4.2.4 扩展集元素定义,4.2.1 术语概念,修饰词: 修饰词是元素修饰词和编码体系修饰词的统称。 修饰词和元素一样识资源的一个属性元素修饰词: 对元素细化或者限定时期更具有专职性和精确性编码体系修饰词: 用
6、来帮助解析某个术语值的上下文信息或解析规则。 形式包括受控词表、规范标示或解析规则。 编码体系修饰词包括两类:词表编码体系修饰词 句法编码体系修饰词,4.2.2 扩展集元素定义规则,定义:对修饰词概念与内涵的说明数据类型:元素值中所表现的数据类型频次范围:术语使用的频次范围注释:修饰词的应用注释修饰:指出该术语所修饰的元素术语类型:元素修饰词还是编码体系修饰词,4.2.3 扩展集的组成结构,元素修饰词和编码体系修饰词列表,4.2.4 扩展集元素定义,基本元数据标准定一了15个核心元数据30个扩展元数据在所定义的修饰词不能满足专门领域活具体应用的识继续趋势,可以服用其他方案的修饰词,也可以根据应
7、用规范补充和修饰元素,4.2 基本元数据扩展规则,横向元素扩展:尽可能复用本领域相关元数据纵向限定扩展:遵循(dumb-down)向上兼容原则从横向纵向两个方向扩展形成专门元数据规范,Marc到基本元数据的映射,1.CNMARC到基本元数据的映射,4.3专门元数据,4.3.1专门元数据基本结构4.3.2专门元数据元素组成4.3.3专门元数据扩展规则,拓片,基本元数据,4.3 专门元数据,基本元数据和专门元数据的关系,论文元数据,古籍元数据,电子图书元数据,拓片元数据,4.3 专门元数据,4.3.1基本结构 核心元素: 在各类资源对象中通用,核心元素复用DC的15个基本元素,在该层上与其它系统进
8、行交换,支持通用的检索工具。 资源类型核心元素: 根据资源对象特点,参照其他元数据标准制定,在同一类型数字资源中通用。不同的资源类型可有不同的资源类型核心元素设置及其予以定义,应用时要求遵守本资源类型的相关规则和定义。 个别元素: 以某种特定的资源对象为基础制定,尽是用于这类对象,不用于交换。,4.3专门元数据,4.3.2专门元数据元素组成-核心元素集,4.3专门元数据,4.3.2专门元数据元素组成资源类型核心元素古文献系列核心元素版本类别载体形态馆藏信息视音频系列:版本、受众、背景、源载体DC-LIB应用纲要中的三个要素:editionlocationaudience,4.3专门元数据,元素
9、组成-个别元素学位论文 学位元素组成修饰词 元素修饰词 编码体系修饰词元数据医院数据规范结构举例,4.3专门元数据的扩展规则,横向扩展:元素层面应遵守核心元素,资源类型核心元素,个别元素的结构组成各元数据标准尽可能采用核心元素集推荐的元数据项,并在语义上保持一致对推荐的元素不能描述特征的可以增加元素,但与已有元素不能有任何语义上的重复,4.3专门元数据,纵向扩展原则为了更准确的描述对象,可以使用修饰词的方式向下扩展一层尽可能使用DCMI制定的修饰词,以及各个应用方案中的修饰词,例如dc-education,dc-lib.尽可能遵守dumb-dowm向上兼容原则,4.3专门元数据,参考资料:期刊
10、、会议、学位论文元数据规范及著录规则肖珑.中文元数据概论与实例.北京图书馆出版社.2007http:/ ,p29-35http:/www.w3.orghttp:/dublincore.orghttp:/http:/ - OAI-PMH元数据获取协议依赖计算机处理能力和标准协议的元搜索 -Z39.50协议,依赖元数据收集的仓储/聚合型,通过抽取、映射等手段从多个分布的异构资源提供者的仓储中(Repository)收割(Harvest)元数据,将之集中保存在本地系统,并在此基础上提供统一的检索和增值服务。数据提供者只要遵循OAI协议的相应要求,提供OAI接口,把自己的元数据暴露出来,服务提供者就可
11、按照OAI协议采集元数据,对外提供相应的服务。,依赖计算机处理能力和标准协议的元搜索,元搜索就是用户只递交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以整体统一的格式呈现到用户面前。而这种元搜索所采用的标准协议主要就是Z39协议。Z39.50协议是分布式虚拟联合数据库检索体系,其目的是实现网上多个数据库检索,规范查询格式,简化检索过程,实现异构系统和不同图书馆系统之间的通信.根据这一标准建立的检索系统可以检索多种不同类型的信息,如文本、图像和多媒体资源等。实现不同数据库系统之间通信,使异构数据库系统及异构网络相互传递信息,目前Z39已经成为一种通用的数据库接口规范。目前国内外的检索系统,尤其是图书馆自动化系统陆续支持Z3950检索协议,馆际间OPAC系统资源整合主要运用Z39标准。OCLC、CSA、OVID、EBSCO、GALE等国外大型数据库都支持Z39检索协议。,参考内容,我国数字化图书馆标准语规范建设网站http:/数字图书馆标准规范发展趋势我国数字图书馆标准规范建设与应用实施指南其它数字图书馆标准规范研究报告其它数字图书馆标准规范,更多内容详见http:/,版权所有请勿转载谢 谢,