1、 ICS 01.140.20 A 14 备案号: 48937-2015 DA 中华人民共和国档案行业标 准 DA/T 57 2014 档案关系型数据库转换为 XML 文件 的技术规范 Archival Relational Database Transform into XML Files 2014-12-31发布 2015-08-01实施 国 家 档 案 局 发 布DA/T 57 2014 I 前 言 本标准由 国家档案局档案科学技术研究所 提出。 本标准由 国家档案局 归口。 本标准起草单位: 国家档案局档案科学技术研究所、中央档案馆、 沈阳东软系统集成工程有限公司 。 本标准主要起草人:
2、 马淑桂、刘伟晏、冯丽伟、李玉民、 郝晨辉、程春雨、曹燕、 黄静涛、徐亮、杜琳琳、李华峰、 纪晓博 、林祥振、刘丹。 DA/T 57 2014 1 档案关系型数据库转换为 XML文件 的 技术 规范 1 范围 本标准规定了 档案关系型数据库 转换为 XML 文件 需遵循的 格式和要求 。 本标准适用于各类各级综合档案馆、机关、团体、企业事业单位和其他社会组织 对 档案关系型数据库 与 XML 文件 的转换 。 2 规范性引用文件 下列文件对于本文件的应用是必不可 少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB
3、2312 信息交换用汉字编码字符集 基本集 GB/T 7408 数据元和交换格式 信息交换 日期和时间表示法 ( ISO 8601:2000, IDT) GB/T 12991.1 2008 信息技术 数据库语言 SQL 第 1 部分: 框架 ( ISO/IEC 9075-1:2003, IDT) GB 13000 2010 信息技术 通用多八位编码字符集( UCS)( ISO/IEC 10646:2003,IDT) GB 18030 2005 信息技术 中文编码字符集 GB/T 18391.3 2009 信息技术 元数据注册系统( MDR) 第 3 部分:注册系统元模型 与 基本属性( ISO
4、/IEC 11179-3:2003, IDT) GB/T 18793 信息技术 可扩展置标语言 ( XML) 1.0 DA/T 46 2009 文书类电子文件元数据方案 DA/T 48 2009 基于 XML 的电子文件封装规范 3 术语 和 定义 DA/T 46 2009、 DA/T 48 2009 界定的以及下列术语和定义适用于本文件。 3.1 必选 mandatory 总是要求的。 GB/T 18391.3 2009,定义 3.2.17 3.2 可选 optional 允许但并非必要的。 GB/T 18391.3 2009,定义 3.2.28 3.3 条件选 conditional 在某
5、一规定条件下所要求的。 GB/T 18391.3 2009,定义 3.2.9 DA/T 57 2014 2 4 总则 4.1 为 实现档案 信息 的格式开放、不绑定软硬件、文件自包含、格式自描述、持续可解释和可转换 , 应将 档案关系型数据库转换为 XML 文件 进行存储。 4.2 XML 文件 的 格式 应符合 GB/T 18793 2002 的规定 。 XML 文件应通过 Schema 进行有效性验证。 5 转换策略 5.1 档案关系型数据库 转换 为 一组 XML 文件 以及 Schema 文件 。 数据库 的 用户、角色、权限 、 数据表结构、 数据表关系、 视图、存储过程、约束、索引
6、、 触发器等 元数据 信息 存储在一个 XML 文件中 ; 数据库的 每个数据表的数据分别 存储 在 不同的 XML 文件 中 。 5.2 存储 数据库 元数据 信息 的 XML 文件命名 为 metadata.xml, 存储 在 header 文件夹中 ;存储 每个数据表的数据 的 XML 文件 以对应的数据表 名称进行命名, 存储 在 content 文件夹中 。 可根据 操作系统、内存、转换效率等 实际情况确定 单个 XML 文件 的大小 , 数据表的 数据 量 较大时 可 分成多个 XML 文件 。 在 content 文件夹中 可以根据数据库的 逻辑结构 建立相应的文件夹。 5.3
7、Schema 文件 的名称 根据 相应 XML 文件 的 名称进行命名 。 存储 数据库元数据信息的 XML文件 的 Schema 见附录 A, 存储数据 表数据 的 XML 文件 的 Schema 见附录 B。 5.4 应对 XML 文件的存储进行合理组织,按一定规则将其分类集中存储。存储结构的示例如图 1 所示 : 注: schema1、 schema2、 schema3为 根据数据库的 逻辑结构 划分的 数据分区 的 名称; table1、 table2、 table3为数据表 的 名称。 table3 的数据 分成了 3个 XML 文件。 图 1 存储结构示例 5.5 在 XML 文件
8、 中,所有二进制数据 可 转 换 为 Base64 编码表示。 DA/T 57 2014 3 6 数据库元数据的 层次 模型 本标准 将 数据库 的 元数据分为 数据库 层 元数据 、 数据 分区 层 元数据 、数据表 层 元数据、列 层 元数据四个 层次 , 如图 2 所示 : 数 据 表 关 系表 名 列1 . . n唯 一 约 束0 . . n索 引0 . . n数 据 库 转 换 包用 户 角 色 权 限 数 据 分 区1 . . n视 图 存 储 过 程数 据 库 名 称1 1 . . n 0 . . n 0 . . n0 . . n触 发 器11数 据 库 软 件1创 建 时 间运
9、 行 平 台1数 据 库 权 属1列 名0 . . 1是 否 必 填是 否 主 键0 . . 1 0 . . 1列 类 型1长 度0 . . 1 0 . . 1列 标 题1精 度 默 认 值0 . . 1消 息 摘 要1数 据 分 区 描 述 数 据 表1 . . n0 . . n0 . . n0 . . n0 . . 1数 据 分 区 名 称1检 查 约 束0 . . n图 2 数据库 元数据的 层次 模型 7 元数据 元素 及描述方法 7.1 元数据元素 元数据元素规定如下 : 表 1 数据库 层 元数据 编号 元数据 编号 元数据 编号 元数据 M301 数据库 转换 包 M309 摘要
10、值 M317 权限 M302 数据库名称 M310 用户 M318 权限类型 M303 运行平台 M311 用户名称 M319 权限主体 M304 数据库软件 M312 用户描述 M320 权限客体 M305 创建时间 M313 角色 M321 可再授权 M306 数据 库 权属 M314 角色名称 M322 授权人 M307 消息摘要 M315 管理权限 M323 权限描述 M308 摘要算法 M316 角色描述 M324 数据分区 DA/T 57 2014 4 表 2 数据分区 层 元数据 编号 元数据 编号 元数据 编号 元数据 M325 数据分区名称 M332 视图 M339 存储过程
11、特征 M326 数据分区描述 M333 视图名称 M340 返回类型 M327 数据表关系 M334 视图列 M341 存储过程参数 M328 关系名称 M335 视图查询 M342 执行代码 M329 父表名 M336 视图描述 M343 存储过程描述 M330 子 表名 M337 存储过程 M344 数据表 M331 列关系 M338 存储过程名称 表 3 数据表 层 元数据 编号 元数据 编号 元数据 编号 元数据 M345 表名 M352 索引 M359 执行时间 M346 唯一约束 M353 索引名 M360 触发事件 M347 唯一约束名 M354 索引列 M361 别名列表 M3
12、48 约束列 M355 是否聚集 M362 触发动作 M349 检查约束 M356 是否唯一 M363 触发器描述 M350 检查约束名 M357 触发器 M364 列 M351 约束表达式 M358 触发器名称 表 4 列 层 元数据 编号 元数据 编号 元数据 编号 元数据 M365 列名 M368 是否主键 M371 是否必填 M366 列标题 M369 长度 M372 默认值 M367 列类型 M370 精度 元数据元素参见附录 C。 7.2 元数据的描述方法 本标准 参考 GB/T 18391.3 2009, 采用表 5 所示方法对元数据元素进行描述。 本标准所描述的元数据元素有四个
13、属性相同: 注册版本: 1.0; 注册机构:中华人民共和国国家档案 局; 字符集: GB 2312 1980、 GB 18030 2005; 语言:中文。 DA/T 57 2014 5 表 5 元数据元素描述 方法 编号 按一定规则 排列的元数据的顺序号 中文名称 元数据元素的中文标识 英文名称 元数据元素的英文标识 定义 元数据元素含义的描述 目的 描述该元数据元素的必要性和作用 约束性 说明采用该元数据元素的强制性程度, 包括 “必选”、 “可选” 和 “条件选” 可重复性 元数据元素是否可以重复出现 元素类型 元数据元素所属的类别 , 包括“ 容器型 ”、“ 简单型 ”和“ 复合型 ”
14、数据类型 为表达元数 据元素值而规定的具有相同数学特性和相同操作集的数据类别。本标准数据类型包括字符型、数值型、日期时间型 、布尔型 。容器型元素没有数据类型 编码修饰体系 对该元数据元素信息的描述应遵循的编码规则,包括编码修饰体系的标识和名称 值域 可以分配给元数据元素的值 缺省值 该元数据元素的默认值 子元素 该元数据元素具有的下属元素 信息来源 元数据元素值的来源 相关元素 与该元素有密切联系的元素 注释 对元素的进一步说明 层次模型 用树形结构表示 元数据元素 之间 的 联系 XML 元素属性 提供关于 XML 元素的 附 加 信息 源代码 XML文件中描述该元素的代码 8 数据库 层
15、 元数据元素的描述 8.1 数据库 转换 包 编号 M301 中文名称 数据库 转换 包 英文名称 database 定义 存放 档案 关系型数据库 的 元数据的 容器 目的 维护档案关系型数据库 的 元数据的完整性,保障 档案关系型数据库的 数据表 数据与元数据 之间的可靠联系 约束性 必选 可重复性 不 可重复 元素类型 容器型 数据类型 编码修饰体系 DA/T 57 2014 6 值域 缺省值 子元素 数据库名称 ( M302) 运行平台 ( M303) 数据 库软件 ( M304) 创建时间 ( M305) 数据 库 权属 ( M306) 消息摘要 ( M307) 用户 ( M310)
16、 角色 ( M313) 权限 ( M317) 数据 分区 ( M324) 信息来源 相关元素 注释 层次模型 XML 元素属性 DA/T 57 2014 7 源代码 8.2 数据库 名称 编号 M302 中文名称 数据库 名称 英文名称 database name 定义 档案关系型 数据库 的 名称 目的 对 数据库 进行 命名 ,有利于数据库的管理与利用 约束性 必选 可重复性 不可重复 元素类型 简单型 数据类型 字符型 编码修饰体系 值域 缺省值 子元素 信息来源 由转换 数据库 的 软件 系统捕获 相关元素 注释 层次模型 XML 元素属性 源代码 DA/T 57 2014 8 8.3
17、 运行平台 编号 M303 中文名称 运行平台 英文名称 operating system 定义 数据库运行环境的操作系统及版本 目的 为数据库的完整和可靠提供保障 约束性 必 选 可重复性 不 可重复 元素类型 简单型 数据类型 字符型 编码修饰体系 值域 缺省值 子元素 信息来源 由转换 数据库 的 软件 系统捕获 或 手工著录 相关元素 注释 层次模型 XML 元素属性 源代码 8.4 数据库软件 编号 M304 中文名称 数据库软件 英文名称 database software 定义 数据库 的 应用软件及版本 目的 为数据库的完整和可靠提供保障 约束性 必 选 可重复性 不 可重复 元素类型 简单型 数据类型 字符型 编码修饰体系 值域 缺省值 子元素