1、 1 湖北省纸质档案数字化操作规程 1 适用范围 本规程规定了纸质档案 (含文书档案、科技档案、会计档案等 )数字化加工的主要技术指标。 本规程适用于湖北省各级综合档案馆。机关、团体、企业事业单位、社会组织参照执行。 2 引用文件 DA/T18-1999 档案著录规则; DA/T22-2000 归档文件整理规则; DA/T31-2005 纸质档案数字化技术规范; 湖北省文书档案目录数据库结构与著录细则(鄂档 200446号); 湖北省国家综合档案馆电子档案数据容灾管理试行办法(鄂档 2010 41 号); 关 于进一步加强档案信息安全保密工作的通知 ( 鄂档办 201419 号 ) 。 3 实
2、施主体 3.1 纸质档案数字化加工的责任主体为实施档案数字化的各级国家综合档案馆及机关、团体、企业事业单位、社会组织(以下简 2 称 “数字化实施单位 ”)。 3.2 纸质档案数字化加工可由数字化实施单位自行组织人员开展,也可以由数字化实施单位采取业务外包的方式委托给具有相关资质和能力的档案数字化服务机构(以下简称 “数字化服务机构 ”)完成。 4 基本原则 4.1 统筹规划,分步实施 根据纸质档案重要程度、破损状况、利用需求等,进行统筹规划,分步实施 。 国家重点档案、重要全宗档案和涉及民生的专业档案应优先 列入数字化加工对象。 数字化应保持原有档案全宗或目录的完整性。 4.2 加强管理,保
3、障安全 遵守保密安全要求,对数字化对象进行划控、鉴定。涉及国家秘密的档案,不得以外包方式委托进行数字化加工。加强档案数字化各个环节的管理工作,确保档案原件和数字化成果的安全。 4.3 完善细节,规范流程 对因涉密不宜以外包方式委托进行数字化加工的对象,应用文字做出说明,并由数字化实施单位组织工作人员集中进行数字化加工。应加强数字化加工流程管理,界定各个环节 的职责任务,堵塞漏洞和缺憾。 4.4 分工协作,夯实基础 加强内设机构的分工协作,把夯实档案基础业务工作与档案数 3 字化相结合,开展传统载体档案清理、整理、鉴定、修裱等基础处理工作,为加快推进档案数字化创造有利条件。 5 基本环节 纸质档
4、案数字化的基本环节为数字化前期准备、数字化前处理、数字化扫描、数字化后处理、数字化成果验收移交。内容主要包括:制定数字化工作方案、案卷整理与交接登记、目录建库、档案扫描、图像处理、图像存储、数据挂接、数据验收、数据备份、数字化成果移交及管理等。数字化操作流程及任务要点见附录 1。 档案数字化从整理分件到案卷还原的各个环节,应以卷(盒)或批次为单位建立档案数字化加工流程单(见附录 2),记录每卷(盒)或每批档案数字化过程, 确保档案扫描加工质量和效率。 6 制定方案 对档案实体的基本情况进行摸底排查,根据排查结果,制定总体规划和分年计划,并按照本规范编制数字化工作方案。包括档案数字化的内容和范围
5、、数量以及先后顺序、数字化的形式、技术参数、时间安排以及经费预算等内容。 7 案卷整理 开展数字化扫描工作之前,应根据纸质档案实际情况,按步骤对档案实体进行整理鉴别,对需要说明、修裱、扫描 等内容进行标识,以确保扫描加工质量和效率。 7.1 分件 按传统方法整理的档案,应将案卷拆分为件进行扫描。件的划 4 分应遵照 DA/T22 的规定进行, 注意保持文件的齐全、完整,尽量避免以组合件的方式进行扫描 。按新方法整理的档案,件的划分遵循档案形成规律和 DA/T22 的要求。 分件过程中,应注意理顺文件的排列顺序。对文件形成过程中产生的,除正本以外的一般性修改稿、底稿、重复件及没有保存意义的制表说
6、明等不予扫描的页面,应加以标注。 为便于数字档案(正文)的利用,应将文件处理签或领导(职能部门)签署的意见、有本级党政 领导亲自批示和审改内容的文件底稿等不便提供利用的文件,在档案目录数据库中进行标识。 7.2 编页 没有编页或编页不规范的档案,原则上应重新进行编页。文书档案正面页号应编在右下角、背面页号应编在左下角,科技档案页号应统一编在右下角,没有信息的档案页面不编号。 页号不应压盖档案内容;重新编写页号时,应将原页号用铅笔划去 ,以示区分。 7.4 装订物处理 对已装订成册,不去除装订物会影响扫描工作进行的档案,应拆除装订物。拆除装订物时 ,应注意保护档案不受损害。 对已装订成册,不去除
7、装订物不影响扫描工作进行的档案,应维持原样 。 7.4 页面修整 对破损严重无法扫描或折皱不平影响图像质量的纸质档案,应 5 先进行技术修复或压平等相应处理后再进行扫描。 7.5 装订还原 纸质档案扫描加工完成后,对拆除过装订物的档案实体进行装订还原。装订还原应符合国家档案装订规范,要保持案卷整齐、卷内文件排列顺序正确、不掉页、不压字等。 对装订还原的档案实体进行质量检查、登记,出现卷内文件不完整、前后顺序排列不正确及装订不符合国家规范等情况,应退回重新整理。 7.6 交接登记 档案数字化过程需要交接的环节 ,应当填写档案调还卷登记表,确保交接清楚,手 续完备,有据可查。 8 建立目录数据库
8、按照国家档案局档案著录规则( DA/T18-1999),湖北省档案局湖北省文书档案目录数据库结构与著录细则(鄂档200446号)等要求,确定目录数据库中的著录项,建立档案目录数据库。 应采用计算机自动校对与人工校对相结合的方式,对目录数据库的质量进行检查,包括目录与内容的一致性、准确性等。 档案数字化之前已经建立了案卷级、文件级目录数据库的,应充分尊重原有基础,并对其进行核对,发现不合格的目录数据 ,应进行修改或重录。 9 元数据 管理与捕获 6 9.1 元数 据管理 9.1.1 档案数字化过程及后期数字化成果管理工作中,应捕获必要的元数据,用以记录数字化项目信息、数字图像生成背景及各类技术参
9、数等,并整合到与档案目录数据库对应的目录条目中。 9.1.2 元数据应采用数字化系统自动捕获和人工录入等方式获取。建议以系统自动捕获为主。捕获过程中应进行 元数据的校验,包括对元数据完整性和赋值规范性的检查等。 9.2 元数据捕获 9.2.1 描述数字化全过程各环节操作完成情况和操作人员等情况的元数据 ; 9.2.2 描述数字化技术环境、过程及各项技术参数的元数据,如数字化时间、数 字化设备、数字化软件、色彩模式、分辨率、存储格式等 ; 9.2.3 描述数字化成果存储位置、读取利用所需技术环境等的元数据,如存储路径、阅读所需软硬件等 ; 9.2.4 用以维护数字化成果法律认可性的元数据,如数字
10、化项目的授权信息、数字化成果的更新维护管理活动相关信息等。 10 档案扫描 10.1 基本原则 10.1.1 应根据纸质档案原件实际情况、数字化目的、设备情况等选择相应扫描方式、设置和调整相关扫描参数。扫描参数的设置和调整,应以保证数字图像不失真、扫描效果最接近档案原件,并 7 能够满足数字化成果利用的要求为 原则 ; 10.1.2 纸质档案数字化后需进行 COM输出、 OCR 识别、出版、仿真复制等的,扫描参数的选择应考虑后期处理的要求。 10.2 扫描方式 按纸质档案幅面的大小选择相应规格的扫描仪进行扫描。大幅面纸质档案,可采用专用数码平台进行扫描或者采用图像拼接方式处理。 纸张状况较差,
11、以及过薄、过软或超厚不宜拆卷的档案,应采用平板或零边距扫描方式;纸张状况好的档案可采用高速扫描方式,以提高工作效率。 10.3 扫描参数 10.3.1 典藏级 纸质档案数字化主要用于精确反映档案原件并长期保存,应采用不低于 24 位彩色 模式进行扫描,扫描分辨率应不小于 300dpi,扫描形成的数字图像应采用无损压缩 TIFF 格式存储。 10.3.2 出版级 纸质档案数字化主要用于备份并提供利用(如出版、仿真复制、COM输出、 OCR 识别等),应采用不低于 24 位彩色模式进行扫描,扫描分辨率应不小于 200dpi。有放大需求、文字偏小或密集时,可提高分辨率。扫描形成的数字图像可存为 TI
12、FT、 JPEG 或 JPEG2000格式,压缩比率的选择应兼顾图像质量与存储空间的要求。 10.3.3 网络浏览级 8 纸质档案数字化主要用于提供网络浏览利用,应通过软件工具将典藏 级或出版级数字图像的分辨率进行转换。分辨率的选择应综合考虑档案原件情况、计算机网络条件等多种因素,建议不小于72dpi。 13.4 图像文件命名 以纸质档案目录数据库为依据,将每一份图像文件命名为档案目录数据库中该份文件的档号。通过档号的唯一性和一致性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。 若扫描对象为一个或多个稿本,应根据具体情况确定图像文件命名方式。 例 1:扫描对象为
13、一个稿本、档号为 “LS015-001-0016-0001”的文件有 3 页,如扫描格式为 JPG,经扫描生成的 3 个 数字图像应分别命名为: LS015-001-0016-0001.001.JPG LS015-001-0016-0001.002.JPG LS015-001-0016-0001.003.JPG 例 2:扫描对象为多个稿本,数字图像名称由文件级档号、稿本代码、稿本内页面流水号 3 个部分构成。稿本代码为: A-正本,B-定稿, C-草稿。以一份档号为 “SZ101-2001-W01-Y-001”的文件正本为 2 页、定稿为 2 页、草稿为 4 页的档案为例,经扫描生成的 8个数
14、字图像 ,应分别命名为: 9 SZ101-2001-W01-Y-001.A.001.JPG SZ101-2001-W01-Y-001.A.002.JPG SZ101-2001-W01-Y-001.B.001.JPG SZ101-2001-W01-Y-001.B.002.JPG SZ101-2001-W01-Y-001.C.001.JPG SZ101-2001-W01-Y-001.C.002.JPG SZ101-2001-W01-Y-001.C.003.JPG SZ101-2001-W01-Y-001.C.004.JPG 11 图像处理 对纸质档案扫描形成的 图像应作质量检查、纠偏、去污、去黑边
15、、拼接等处理。 11.1 质量检查 11.1.1 对图像偏斜度、清晰度、失真度等进行检查。发现不符合质量要求的图像,应重新进行扫描 ; 11.1.2 发现文件漏扫时,应及时补扫并正确插入 ; 11.1.3 发现图像的排列顺序与档案原件不一致时,应及时进行调整 ; 11.1.4 发现图像重复时,应及时删除重复部分。 11.2 纠偏 对扫描过程中出现的偏斜图像应进行整体纠正,保证图像的偏斜角度小于 1 度(图像偏斜不超过页面内半个文字 ) ;对方向不正确的图像应进行旋转处理,以符合阅读习惯。 10 11.3 去污 对扫描过程中产生的污点、污线、黑边等影响图像质量杂质的,应进行去污处理。处理过程应严
16、格遵循展现档案原貌的原则,不得去除档案页面原有的纸张褪变斑点、水渍、污点、装订孔等。 11.4 拼接 对大幅面档案进行分区扫描而形成的多幅图像,应进行拼接处理,合并为一个完整的图像。 13. 数据挂接 应借助相关软件对汇总后的目录数据与图像数据进行批量、快速挂接,以实现目录数据与图像数据的关联和一一对应。 对挂接后的数据逐条进行检查 ,包括目录信息与图像文件对应的准确性、已挂接图像文件与实际扫描数量的一致性、图像文 件能否正常打开等,发现错误应及时纠正。 13. 检查验收 数字化实施单位应指定专人或通过业务外包方式聘请具有相关资质的专业监理公司,对纸质档案数字化形成的数据及档案实体还原情况进行检查验收 ,并填写档案数据及档案实体还原质量报告单(见附录 3)。 检查验收内容包括目录数据、图像数据 、数据挂接 (见附录 2、3),以及档案实体。 检查方式应按加工批次随机抽检,抽检率不低于 10%,合格率不低于 98%。档案实体还原情况抽检率为 100%,合格率要求 100%。