1、高校档案管理系统信息仓储技术及相关问题分析摘要 本文结合高校档案管理系统自动化的特点,介绍了用于高校档案管理系统的信息仓储技术。重点阐述了各种数据网络存储技术及其利弊,指出了基于 IP 的存储网络对于高校档案管理系统的适用性;并就当前高校档案管理信息仓储系统建设中的若干问题进行了探讨和分析。 关键词 档案管理 自动化 信息仓储 网络存储 在网络环境日益广泛化、复杂化的今天,如何有效地应用信息仓储技术为高校档案管理服务是一个值得研究的课题。信息仓储拥有数字化资源、网络化存取和分布式管理三个基本要素,应该说正好和高校档案管理自动化的要求相吻合。高校档案管理系统自动化的特点是:实现与网络及各种通讯系
2、统的完美联结;存储具有数据安全性、响应速度及扩充性;满足数据的可访问性需求。鉴于篇幅,本文主要谈谈档案管理系统中的信息仓储技术以及相关建设和应用问题。 一、用于高校档案管理系统中的信息仓储技术 信息仓储技术主要涉及到数据网络存储技术和数据仓库等。根据档案管理系统的规模,这里主要介绍数据网络存储技术。依据其出现时间的先后,大致可将数据存储技术的发展分为 4 个阶段:直接附属存储(DAS)、网络附属存储(NAS)、存储区域网(SAN)和 IP 存储(IPS)。 1、DAS。20 世纪 90 年代以前,存储产品大多作为服务器的附属设备通过电缆直接连接到各种服务器,这种形式即是 DAS。DAS 完全以
3、服务器为中心,不带有任何存储操作系统。DAS 方式是长期以来大多数服务器采取的方式。主机通过专用接口与存储设备相连接,透过 RAID 技术将这些单个硬盘,按 RAID level 组合成更大的硬盘。当主机需要访问存储设备时,主机发出指令给存储设备,存储设备根据指令进行相应操作,将数据返回给主机,或者将主机传输过来的数据写入到磁盘。DAS 中存储设备可以是磁盘驱动器,也可以是 RAID 子系统,或是其他存储设备。 DAS 技术的数据安全性差,难以备份/恢复;性能一般,可扩充性差,容量有限;数据被存放在多台不同的服务器上,难于访问,不支持不同操作系统的访问。DAS 技术成本低廉,易于安装,但需停止
4、用户现有系统,且难以维护,存储利用率低。 2、NAS。20 世纪 90 年代出现了 NAS 技术。NAS 包括存储部件和集成在一起的简易服务器管理软件。NAS 是一种将分布、独立的数据整合为大型、集中化管理的数据中心。NAS 通常在一个局域网上占有自己的节点。在这种配置中,一台 NAS 服务器处理网络上的所有数据,将负载从应用或企业服务器上卸载下来。集成在 NAS 设备中的定制服务器系统可以将有关存储的功能与应用服务器执行的其他功能分隔开。NAS 设备的物理位置灵活,通过物理链路与网络连接。NAS 无需应用服务器的干预,允许用户在网络上存取数据。 NAS 的特点是,易于备份/恢复;性能高,可扩
5、充性强,即插即用,容量无限制,数据被整合并存放在相同的存储器上,易于访问,支持不同操作系统访问。NAS 技术成本低廉,易于安装和维护,存储利用率较高。 3、SAN。SAN 是允许在存储设备和处理器(服务器)之间建立直接的高速网络连接,通过这种连接实现只受光纤线路长度限制的集中式存储。SAN可以被看作是存储总路线概念的一个扩展,它使用局域网和广域网中类似的单元,实现存储设备和服务器之间的互联。SAN 具有高传输速度、远传输距离和支持数量众多的设备等优点。采用了专用的拓扑结构,不能直接使用通用的 IP 网络连接各个 SAN 存储网络。目前,多数供应商的SAN 解决方案大多采用光纤通道技术,即 FC
6、SAN。 SAN 技术的特点是,易于备份/恢复;性能极高,可扩充性强,即插即用,容量无极限;数据被整合并存放在相同或不同的存储器上,提供统一的用户访问界面,易于访问,但不支持不同操作系统的访问。SAN 技术成本昂贵,需要长时间的设计和安装,且难以维护,存储利用率很高。 4、IP 存储。IP 存储技术就是以高速以太网连接为基础,通过 IP 协议进行数据交换的存储技术。它将 SCSI 协议映射到 TCP/IP 协议上,使得SCSI 的命令、数据和状态可以在传统的 IP 网上传输,其支持数据块形式的 I/O 访问和共享存储。它采用 IFCP 和 iSCSI 协议,由于光纤通道已经包含了 SCSI 协
7、议,这种方法无需重大技术改造,就能满足协议的要求。 IP 技术的特点是,易于备份/恢复;性能高,可扩充性强,即插即用,容量无极限;数据被整合并存放在相同或不同的存储器上,提供统一的用户访问视图,易于访问,支持不同操作系统访问。IP 技术成本低廉,易于安装和维护,存储利用率最高。 二、基于 IP 存储的高校档案管理系统建设 在网络存储中,FCSAN 在某些方面具有无可比拟的优势,如性能极高,可扩充性强等,使其能够满足高校档案管理系统大规模数据存储的需要,但光纤通道存在着成本昂贵和互操作性问题,这是一般高校档案管理系统所不能承受的。而 NAS 技术虽然成本低廉,但却受到带宽消耗的限制,无法完成大容
8、量存储的应用,而且系统难以满足开放性的要求。针对以上技术的缺陷和不足,根据国际上基于 IP 的存储设备已日渐成熟的情况,业内提出了一种既有 NAS 和 SAN 技术的优点,又能克服两者缺点的存储网方案,即基于 IP 的 SAN。它由两部分构成,第一部分是利用 IP 互连设备构成存储区域网 SAN,第二部分是通过 SAN 中的交换机多路接入局域网LAN 回路,形成一种广义的附网存储 NAS,存储设备都是商用的 NAS 设备以及 iSCSIi 设备,或通过转换桥将 SCSI 和 FC 设备转换为 IP 接口,接入基于 IP 协议 SAN 中。它采用最广泛的 TCP/IP 作为网络协议,既具有NAS
9、 易于访问的特点,又有专用的存储网络架构。因此,基于 IP 的存储网络可以利用以太网技术和设备来构建专用的存储网络,由于使用了以太网设备,其成本大大低于使用光纤交换机的 SAN 网络,而且保持了 SAN的传输速率高且稳定的优点。用户在这一技术中,面对的是非常熟悉的技术内容,即 IP 协议和以太网,而且各种 IP 通用设备保证了用户可以具有非常广泛的选择空间。事实上,由于 IP 存储技术的设计目标,就是充分利用现有设备,使传统的 SCSI 存储设备和光纤存储设备都可以在IPSAN 中利用起来。随着带有 IP 标准接口的存储设备的出现,我们可以单纯使用本地 IP 存储技术,来扩展已有的存储网络,或
10、构建新的存储网络。以千兆甚至万兆以太网为骨干的网络连接,保证了本地 IP 存储网络。由于采用的是 IP 协议,与 LAN 和互联网的连接是无缝的,远程备份十分方便,效率工作很高。基于 IP 的 SAN 在性能及功能上都具有突出的优势,是目前高校档案管理系统建设中存储区域方案设计的首选方案。 三、高校档案管理信息仓储系统建设中若干问题分析 推进高校档案管理系统自动化的目的在于开发应用,离开促进应用水平的提高,就脱离了实际。笔者以为,推进高校档案管理系统自动化的指导思想,一是要积极进取,开拓创新,争取条件采用先进技术;二是要充分掌握系统的综合性、系统性、统一性,统筹兼顾,全面安排,调动各方面的积极
11、性;三是要从现实出发,循序渐进。如何提高应用水平,需要深入考察与档案管理自动化系统相关的诸多方面的情况及变化趋势,分析存在的问题,寻求解决的途径。总体来说,应该注意以下几点。 1、档案信息仓储建设首先必须提高档案标准化、规范化水平。当前,高校档案管理系统的现状是档案标准化、规范化滞后和应用软件多乱,这些都严重影响了系统整体水平的提高。目前系统的主要矛盾不是硬件设备的缺乏,而是硬件的功能并没有充分发挥。笔者认为对这一问题取得共识是系统建设思想上的一次飞跃,它使我们的观察视野从计算机系统扩大到整个档案信息管理。这一认识上的转变给我们的启示是:档案管理系统自动化的内涵包括档案工作的各个方面和各个环节
12、,其中首要的是档案业务要规范,档案标准要建立健全和真正实施。档案标准和规范本身也是一个系统工程,要推进档案自动化建设,必须抓好档案标准化、规范化,掌握好两者相辅相成、互相促进的辩证关系。 2、档案信息仓储建设要着眼于提高系统的整体水平。根据系统论思想和集成化要求,档案管理系统自动化建设的着眼点应是整个系统,组成系统的纵向和横向的各个节点都应达到一定水平,并通过网络加以联通,这样才能发挥整体优势,提高系统的综合能力。部分节点甚至一个重要节点的障碍,都可能造成系统的梗阻。当然,要求每个节点的装备水平和应用能力齐头并进是不现实的,不可能“齐步走” 。鼓励和支持先进单位提高水平,在一些单位进行较高水平
13、的试点,以取得值得推广的经验,对整个系统是有利的,但其基本出发点应是为了提高系统的整体水平,只有少数先进的节点不可能组成先进的系统。 3、档案信息仓储建设要有重点地抓好数据库建设。目前档案管理自动化系统从总体上看仍处于由文件处理向信息管理系统的过渡阶段,完成这一步的关键在于数据库建设。开发和建设数据库系统是国家档案信息工程的核心和基础,是工程的主体。数据库的含义是依托先进的信息技术对资料进行科学的管理和方便的使用。建立数据库系统是一项长期的任务,要经过由低到高、由单个到群体的循序渐进过程。经过试点,数据库经验中最主要的有:领导重视,统一认识,坚持计算机技术人员同档案业务人员协同配合;面向应用,
14、建立“活库” ,以利用频率和使用效率考核数据库的“活性” ;突出重点,由单一库向系统库发展等。当前若能把综合数据库的完善提高和各单位档案目录库建立起来,通过网络联接形成开放的分步式数据库群,将使自动化系统效率大大提高一步。 4、档案信息仓储建设必须慎重选定技术路线。在信息技术发展日新月异的条件下,选择档案管理自动化系统的技术路线是十分重要的,应当推行成熟的、适应的先进技术,使经济效益的合理性和技术的先进性相统一,技术路线的选择要符合学校的实际。档案部门对先进技术的潜在需求很大,但现实的需求又往往跟不上,宏观监测需要的信息量和使用频率同微观经济需求有很大差别,因此不断发生买了设备不能充分利用,建了网络而传输量很少的情况。要实事求是地分析现状,充分考虑先进技术的发展,再进行每一项具体的决策。 参考文献 1.赵文辉.网络存储技术.清华大学出版社,2005