1、1浅议“大数据”时代下的电子档案建设趋势国务院 8 月 17 日发布国务院关于印发“宽带中国”战略及实施方案的通知 ,以加强战略引导和系统部署,推动中国宽带基础设施快速健康发展。到 2015 年,基本实现城市光纤到楼入户、农村宽带进乡入村,固定宽带家庭普及率达到 50%,行政村通宽带比例达到 95%,学校、图书馆、医院等公益机构基本实现宽带接入;宽带应用深度融入生产生活,移动互联网全面普及;技术创新和产业竞争力达到国际先进水平,形成较为健全的网络与信息安全保障体系。宽带网络是新时期中国经济社会发展的战略性公共基础设施,发展宽带网络对拉动有效投资和促进信息消费、推进发展方式转变和小康社会建设具有
2、重要支撑作用。 “宽带中国”的发展目标和路径为电子档案的整合、发展、融入与应用描述了一个激动人心的前景。 1 概念界定 1.1 大数据的概念。大数据又称“巨量资料” 、 “海量资料” ,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理,并整理成为帮助用户筛选决策的积极资讯。 “大数据”是由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的整合共享,交叉复用,形成的智力资源和知识服务能力。 1.2 大数据的特点。 “大数据”的英文翻译是“Big Data”,是继云2计算、物联网之后信息技术产业又一次颠覆性的技术变革
3、。大数据时代数据成为核心的资产,对各行业传统业务模式形成挑战,如果不能运用大数据理解用户需要并高效分析作出判断,将对事业发展、行业决策、业务流程形成巨大的阻碍力量。一是数据体量巨大(Volume) 。当前,典型个人计算机硬盘的容量为 TB 量级,而一些大企业的数据量已经接近 EB量级。二是数据类型繁多(Variety) 。这种类型的多样性也让数据被分为结构化数据和非结构化数据。除了以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。三是价值密度低(Value) 。如何通过强大的机器算法更迅速地完成数据的价
4、值“提纯”成为目前大数据背景下亟待解决的难题。四是处理速度快(Velocity) 。这是大数据区分于传统数据挖掘的最显著特征。在如此海量的数据面前,处理数据的速度和效率就是行业的生命。 1.3 电子档案的概念。电子档案是指通过计算机磁盘等设备进行存储,与纸质档案相对应、相互关联的通用电子图像文件集合。在大数据背景下,电子档案是具备数量巨大、结构复杂、类型众多特征的数据集合。 1.4 电子档案的建设目标。一是以电子影像技术为支撑,将纸质档案转化为电子信息进行管理。二是把应用系统的电子信息进行凭证化处理后,形成电子档案,将电子信息从应用系统中独立出来,形成与应用无关的、不可更改的、能够直接阅读的、
5、具有法律效力的文档。一言概之,就是实现纸质档案的电子化管理和电子信息的档案化管理。 31.5 电子档案建设环境的功能设计。理想中的电子档案环境应是为各类档案提供统一的形成、积累、捕获、迁移、鉴定、管理、归档、查询、加载、展现、应用的平台。 1.5.1 统一电子档案入口。能够以影像技术、条形码技术、版式电子数据文件等技术为支撑,实现对不同介质、不同类别的档案进行标准化封装处理,转化为统一的入口文件,并保证电子档案的真实性、完整性、有效性和可追溯性。 1.5.2 对采集的电子档案进行统一管理。根据档案管理的相关规定,采用流程化方式对登记、归档、整理、移交、接收、保管、迁移、鉴定销毁、查询借阅、备份
6、恢复等覆盖案卷整个生命周期的各环节进行全过程管理与监控。并能够实现对流程的后台日志进行记录查询等操作,随时自动记录实施操作的人员、时间、设备、项目、内容等。 1.5.3 系统应提供对档案流程的自定义。使用产品化的流程管理工具,实现流程的可维护性。流程管理工具应满足自定义需求。当电子档案流程变化时,档案员能够自行通过平台增加、删除或修改流程。并能够根据业务需要,为每个环节设置分配不同的业务角色,采取可靠的安全防护技术,满足各类业务档案管理流程不同的需要。 1.5.4 能够功能拓展满足新业务加载需求。统一的电子档案管理平台搭建好后,并在其上加载常规档案管理业务(如,以卷为单位的文书档案和以件为单位
7、的文书档案管理模块) ,实现所有的操作人员能够在同一个平台上,对不同类别的档案进行管理。该平台应支持多类别档案的业务加载,档案员根据新增工作需求,能够使用平台提供的工具,自行4实现其他门类电子档案(如,专题档案、业务档案)的添加及修改,能将非通用文件格式的图像电子文件转换成通用格式,或将相关软件一并收集,并注明其软硬件环境和相关数据。 1.5.5 实现电子档案的真实性、完整性和有效性。规范的制度、工作程序、可靠的安全防护技术措施、安全保密规定和防范对策是必要条件。一方面,应用支撑环境能够通过数字证书、电子印章等先进技术保证电子档案的凭证性、依据性和法律价值。另一方面,要保证电子档案封装、传输过
8、程,整理、归档过程,保管和利用过程中的信息安全。要实现对电子档案安全级别的划分和标志,并根据不同的级别和权限进行访问控制。从电子文件形成开始全流程对所有处理操作环节进行登记记录,保证处理过程透明公开合规。 1.5.6 实现灵活放权、方便管理。系统能够采用 CA 和数据加密技术实现用户对数据访问的身份控制。权限体系能够适应档案系统不同的涉密程度、不同的保管期限划定、不同的阅读人群,适应不同的管理模式。能够实现权限的分级管理、共享使用、分组共享、分别配置和临时发放等。安全可靠、适时记录的操作日志将是灵活放权的技术保障。 2 电子档案建设的政策依据 2013 年 5 月,河南省信息化工作领导小组印发
9、了2013 年河南省信息化建设专项方案的通知 。通知要求:推进数字图书馆、数字博物馆、电子阅览室等公益性文化信息化基础设施共建、共享、共用。推进数字档案馆建设和电子文件中心建设,逐步建立档案信息资源基础数据库,实现馆藏档案数字化。 2012 年 12 月 25 日,国家档案局杨冬权局5长在全国档案局馆长会议上的讲话要求:加快档案信息化建设,提高档案科技的驱动力。各级档案馆、室都要把数字化作为主要业务,以数字化为龙头,带动档案信息化与档案服务体系深度融合,从 2013 年开始搭建全国开放档案与政府公开信息资源共享平台,今后每年,每个省级副省级市档案馆要上传 2 万件以上的开放档案全文。 河南省档
10、案局要求全省各级综合档案馆加快数字化进程,省档案馆每年完成 70 万、各省辖市档案馆完成 40 万页,各县(市、区)档案馆每年完成 6 万页的数字化扫描任务,到 2020 年实现全省各级综合档案馆馆藏纸质档案数字总量比 2012 年翻两番的目标,同时抓好新增档案的双载体接收。 在“宽带中国”的信息战略引导和“大数据”扑面而来的时代背景下,档案信息化得到了前所未有的发展环境和载体支撑。如何顺势而上、乘势而为,考验着档案事业的领导者、档案专业技术人员的智慧和执行力。良好的环境如何创造一流业绩,如何在国家支持信息产业大发展的契机中完成档案信息化的加速度发展?是各级档案工作者不可掉以轻心的重大课题。
11、3 电子档案建设的保障措施 3.1 建立以服务为主导的档案信息化体系。各级档案部门进一步统一思想,凝聚力量,在“宽带中国”的部署实施中,加快推进档案信息化建设步伐,及时协调解决档案信息化推进过程中的重大问题。积极与各级信息化工作领导小组沟通,将档案信息化纳入到本地、本部门电子政务和民生信息化建设中,新技术研发、新成果推广尽快应用到档案信6息化建设中,努力实现档案信息化的新突破和新发展,完善档案信息数据库建设,逐步实现档案信息的交换与共享。 3.2 加大档案信息化的资金投入。按照国家档案局、河南省信息化工作领导小组要求,各级档案部门应积极向财政部门反映,要求落实有关资金扶持政策,加大信息化资金投
12、入。按照信息化目标考核要求,出台政策,强力推进,为档案信息化顺利推进创造条件。 3.3 严格信息化体系建设质量标准。建立各级数字档案馆(室)与信息安全综合管控平台,实现档案信息的发布、监管、通报、防控一体化。按照公安部有关计算机信息管理系统安全工作的要求,严格执行档案信息安全等级保护定级指标,启用测评软件,完善信息安全测评体系,制订各级各单位的档案信息化应急预案,实施模拟演练,确保档案信息化安全发展。认真贯彻落实电子文件归档与管理规范 、 电子档案移交与接收办法 ,制定配套规章、标准,尽快出台数字档案馆评估指标体系 ,做好电子档案接收与保存的试点工作。 3.4 了解“大数据”动态,跟进“大数据
13、”脚步,用处理“大数据”的技术视野推进档案信息化建设。越来越广泛的信息应用改变了各行各业决策的速率和准确率。大数据时代不仅数据量大,更新迅速,使用更具随机性,数据结构异常复杂,80%以上都是诸如文本、视频、音频、邮件、图片等非结构化数据,数据格式之间互不兼容,给数据的提取、分析、应用带来很多困难。 企业和市场像猎豹一样永远拥有敏锐的嗅觉,当企业和市场进入到对“大数据”的实施和行动阶段后,处理非结构化数据库工具的先进性、7方便性得到了越来越多的认可。档案信息化也应从中吸取经验,接受“大数据”工具处理非结构化数据库的技术和理念,从海量档案信息中筛选、整合、获取关键信息满足用户需求。 (作者单位:河南中医学院 来稿日期:2013-08-20)