1、XML 在电子档案管理系统中的应用与实现摘 要XML(eXtensible Markup Language)即可扩展标识语言,不仅是一种标识语言,更是一种可以定义描述对象结构的元语言,可用来设计与特定专业领域有关的标记语言。本文较详细地讨论了 XML 在电子档案管理系统中的各项用途。由于电子档案领域极具动态性与安全性,实现该领域中的系统无疑需要一定的灵活性。具有严格结构和数据定义的程序在此方面遇到严峻的挑战,而基于 XML 电子档案管理系统的灵活性与安全性能够非常简单地适应文档和程序的最新要求。 关键词XML;电子档案;系统 中图分类号:TP311.52 文献标识码:A 文章编号:1009-9
2、14X(2015)23-0192-01 1.引言 20 世纪 90 年代初,电子档案管理这一概念从西方引入我国。从以目录管理为主要特征的第一代档案管理软件,到以电子文件管理为主要特征的第二代档案管理软件,电子档案管理系统极大地提高了档案的收集、整理、查询速度,增强了工作效率和信息资源的利用率。近几年,随着信息技术的不断发展和应用的不断深入,现有电子档案管理系统已经越来越不能满足人们对电子档案的灵活性与安全性的需要了。 2.传统电子档案管理系统存在的问题 目前的电子档案管理系统,由于缺乏对大量非结构化文档进行有效管理与检索的手段,使得大部分电子档案的日常管理仍停留在半自动半手工操作上。档案格式不
3、统一、兼容性差、浏览和查询效率低,诸多原因归根到底在于电子档案管理系统本身的局限性。 1)规范化和标准化程度较低: 电子档案管理系统以数据管理为核心,在数据库等计算机信息系统的支持下,对档案的各种信息进行收集、整理、存储、检索、统计和传播。但目前,电子档案在共享性和普适性方面并不能满足要求。为了实现对档案信息的有效管理和操作,就要把这些信息转换为规范的数据格式,并使之适应档案管理的要求。这些原则、规范和标准必须在电子档案管理系统设计开发前转化为具体的功能需求,被事先提出来。否则,真正意义上的电子档案管理系统就很难开发成功。 2)体系结构的缺陷 现有电子档案管理系统大多数还停留在 C/S 体系结
4、构模式上,而没有应用以 Web 技术为核心、MVC 三层体系为架构的 B/S 结构模式。虽然C/S 模式在用户界面、信息安全控制等方面具有一定的优势,但电子档案不便于交流和共享,不便于长期存档和查询,不便于在 Internet 上发布等缺陷却难以克服。 3)安全性不佳 电子档案的安全性包括其真实性、完整性和可靠性。在实际工作中,影响这些性质的因素有很多。因此,从系统架构的权限保密设计到电子档案自身的加密签名技术都提出了很高的要求。 3.基于 XML 的电子档案管理系统 3.1 基于 XML 格式的电子档案的优点 基于 XML 技术的特性及相关规范和协议,电子档案统一采用 XML 格式后,目前所
5、存在的诸多问题,基本可以得到解决。这是因为 XML 文档具有许多优点: 1)XML 文档是纯文本文件,可读性很强,即使不借助任何 XML 浏览工具,也能看懂其内容。另外,XML 文档格式良好,有严格的语法要求,也适合通过程序进行处理。因此,电子档案的再利用和跨平台便不再是一个问题。 2)通过定义档案的 DTD 或 Schema,保证了电子档案的完整和规范。如一篇电子档案必须有一个标题,通过定义,则可以约束档案编撰人必须输入标题,这样就不会出现多项或漏项。 3)通过定义档案的显示样式单,使得编撰档案时无需考虑文字的字体、大小、位置等显示格式,只需关注档案的内容。另外,针对 XML 文档可以定义多
6、种样式单,使其具有多种显示格式,适用于不同的场合。 4)基于 XML 的文档查询标准。利用 XQL(XML 查询语言)语言,在XML 文档中检索,就像在数据库中使用 SQL 语言一样方便。并且,大量的基于 XML 的电子档案在 Intranet 发布后,可以快速查询到更多所需要的信息。 3.2 基于 XML 的电子档案管理系统总体架构 基于 XML 的电子档案管理系统总体架构可分为“档案收集与转换模块” 、 “档案查询与显示模块”以及贯穿整个系统的“数字签名技术”与“权限控制技术” 。 3.3 档案收集与转换模块 现在的电子档案中,档案格式类型众多(例如Word、Excel、txt、PDF 等
7、) ,不便于管理。所以应减少文档的格式类型,制定统一标准才能实现跨平台,才能最大限度的避免重复建设,减少浪费,提高资源利用率。系统收集 XML 电子档案有以下两种方式: 1)档案上传。在上传电子档案时,存在许多不同文档编辑器编写的格式不统一的电子档案。这时,系统首先将上传的不同类型文件进行自动分类,然后根据其原始格式分别进行格式转换,最终统一将其转换为XML 格式。 2)在线编辑。另一种情况是“在线编辑” ,用户直接新建一个 XML格式的电子档案,将之上传,最后进行归档。这种方式是以网页提取单的形式存在。如果用户需要提交一份电子档案,首先通过客户端向服务器发出请求,服务器根据对应的档案格式定义
8、,利用 Web 技术在客户端生成档案的输入界面,用户只需在各项栏目里填入内容即可。例如:建档日期、建档人、标题等。 3.4 档案查询与显示模块 由于 XML 描述的是一种结构化的数据内容,而不是数据的显示,计算机可以对这些数据进行各种处理。与以往的查询模式不同,基于 XML的查询模式更灵活。它是基于元数据的查询,它不仅可以针对某个特定档案查询,更可以针对某个内容查询。根据用户的需要,权限的不同而显示不同的查询结果。 3.5 数字签名技术 所谓“数字签名“就是通过某种密码运算生成一系列符号及代码组成电子密码进行签名,来代替书写签名或印章,对于这种电子式的签名还可进行技术验证,其验证的准确度是一般
9、手工签名和图章无法比拟的。“数字签名“是目前应用最普遍、技术最成熟、可操作性最强的一种电子签名方法。它采用了规范化的程序和科学化的方法,用于鉴定签名人的身份以及对一项电子数据内容的认可。它还能验证出电子文件的原文在传输过程中有无变动,确保传输电子文件的完整性、真实性和不可抵赖性。1)待签数据的 URI 建模方式扩大了签名的作用范围,更符合分布式网络环境的资源特点。 2)签名结果保持 XML 文档的结构,多种封装类型更便于数字签名的存储和管理。 3)签名密钥表示形式的语义清晰、易读,提高了签名的可移植性和自动验证的能力。XML 数字签名不需其他专门工具,任何 XML 解析器都能解析元素得到正确的
10、签名密钥,更能满足应用程序用 XML 来交换和发布网络数据的需要。 3.6 权限控制技术 现有的电子档案管理系统对权限的控制制定的比较笼统。如:用户只分为系统管理员、领导和普通员工,权限也仅仅是对全文的浏览。若一份档案中某一处不能公开,则整个档案不得公开。因此电子档案管理系统的设计应充分考虑到用户权限的多样性和可变性。管理员可以对用户进行增、删、改、查,把用户分配到组。用户按不同级别分组,再按组进行角色和权限分配,以简化管理。访问者的权限在访问过程中是变化的。 4.结语 基于 XML 电子档案管理系统的灵活性能够非常简单地适应电子档案和程序的最新要求。采用 XML 记录的档案不依赖于任何计算机平台、软件或者数据库格式,不会因为软硬件更新而需做相应的升级工作;便于信息交换和查询;同时也提高了电子档案的安全级别。由于 XML 对内容进行了标记,因而其中的信息可以方便地在用户之间进行交换和检索;XML 允许用户在不违背标准的前提下根据自己当前和今后的需要进行扩充,具有很大的适应性和灵活性;结合数字签名实现其完整性,由此构成了电子档案的安全基础。