1、1如何做好库存档案的电子化工作摘 要 档案馆库存的资料,尤其是 20 世纪的老资料多为纸质资料,借阅及资料的二次开发利用不方便,只有做好库存档案资料的电子化工作,才能更好地发挥档案资料的作用。 关键词 档案;资料;电子化;二次开发 doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 12. 028 中图分类号 F272.7;G275 文献标识码 A 文章编号 1673 - 0194(2014)12- 0045- 01 0 引 言 档案馆库存的纸质档案资料存在以下几个特点:保存不便,保存时限有限,年久容易损坏,防火、防潮、防虫等安全系数不高;对库房
2、的容量要求比较高,随着地勘单位承担的地勘项目越来越多,向档案馆汇交存档的纸质档案资料越来越多,档案馆库存的压力越来越大;借阅、利用不便,很多图纸图幅大,翻阅不便,容易损坏;资料的二次开发利用不便,大部分地质资料的二次开发是建立在电子版的基础上。由此,档案馆库存的纸质档案资料电子化工作刻不容缓,如何高效做好纸质资料电子化工作对档案工作人员的综合素质要求很高。 1 准备工作 1.1 仪器、设备 (1)电脑。要求配置高,运行内存大,对提高大型图件及软件运行2速度有利;存储内存要求大,扫描高质量的图件所占内存较大。 (2)扫描仪。选择扫描速度快,大小合适的扫描仪。可从以下几个性能指标来挑选。 分辨率:
3、分辨率反映的是扫描图像的清晰程度。选择分辨率时要适合图纸扫描,但也不能过大,分辨率越大所占内存越大,对存储配置要求就越高。色彩位数:色彩位数反映了扫描图像与实物在色彩上的接近程度。色彩的位数越高则扫描仪所能反映的色彩越丰富,扫描出的图像也越真实。感光元件:扫描仪所使用的感光元件有光电倍增管、CCD 电荷耦合器件和 CIS 接触式图像传感器 3 种,光电倍增管是 3 种感光元件中性能最好的。扫描幅面:扫描仪的幅面规格一般有 A4、A4 加长、A3、A1 等。建议配置两台不同规格的扫描仪,A4 幅面的扫描报告及附表、附件类,A1 幅面的扫描图纸类。 1.2 软件 (1)Photoshop。Phot
4、oshop 是对扫描的图像格式的文件进行处理的软件,扫描后的图像在经过 Photoshop 裁剪、修饰、旋转、锐化照片以及去除扫描时产生的暗边等处理后才能存档。 (2)OCR 文字识别。扫描的报告类资料是图片格式,资料二次利用不方便,需将其转换成可编辑的文档。靠手工录入比较费时,可安装 OCR文字识别类软件。OCR 软件的应用对文字资料的整理非常方便,替代了人工键入文字的工作,大大缩短了录入时间,减轻了劳动强度,节省了人力且降低了费用,提高了录入正确率、工作效率和现代办公自动化程度。选择 OCR 文字识别类软件时注意其是否能够识别各种印刷体、手写体、3表格以及能否识别中英文混排等因素。 (3)
5、MapGIS 图形处理软件。MapGIS 是中国地质大学武汉中地信息工程有限公司开发的地理信息系统平台,广泛适用于地质、矿产、地理、测绘、城建、土地管理、水利、交通等领域。与传统制图相比较,MapGIS 具有成图周期短、速度快、精度高等特点,工作效率高,节省人力。成图后,对于地形地质图的二次开发利用作用明显,在单一的地形地质图上添加不同的专业内容,如添加地质、物探、水文要素,可以生成各种专题地图,应用广泛。 (4)AutoCAD 图形处理软件。AutoCAD 是由美国 Autodesk 公司开发的通用计算机辅助设计软件,能够绘制二维图形与三维图形、标注尺寸、渲染图形以及打印输出图纸,目前已广泛
6、应用于机械、建筑、土木工程、冶金、地质、气象、纺织、轻工、商业等领域。 工程勘察领域的图件资料多使用 AutoCAD 进行矢量化。 2 电子化工作 2.1 一般纸质档案资料的电子化 一般纸质档案资料指文书档案、报告及其附表、附件等无大型图件的资料,该类资料内容多为文字。该类资料的电子化先选择适合档案资料篇幅的扫描仪进行扫描,扫描时统一编号、命名,保存时选择 JPEG 格式存档。扫描后使用 Photoshop 进行修饰及去除暗边等处理后才能存档。对成果报告类档案资料,除存档图片格式外,还应将其使用 OCR 文字识别类软件进行处理,将其转录成可编辑的文档类资料,以便日后资料二次开发利用。 42.2
7、 图件的电子化 地形地质图等图件类档案资料在扫描仪扫描后还应进行矢量化。 2.2.1 地形地质图的矢量化 (1)扫描。地形地质图扫描时比例不能缩放,保存时选择 Tiff 栅格格式,扫描后使用 Photoshop 进行修饰,调整水平。 (2)标准/非标准分幅的影像校正。由于原图图纸变形和扫描时存在一定的系统误差,在扫描后应进行图形校正,消除输入图形的变形,校正后的图形可直接在图上读取实际坐标。 (3)矢量化。按照国标的图例,对图件进行矢量化,将矢量数据分别存入到点文件(*.WT) 、线文件(*.WL)和面文件(*.WP)中。在开始矢量化前,可先建立图例库,矢量化时更加快捷;矢量化时一定要先建好图
8、层,将不同的图形实体存放在不同的图层上,为以后的利用提供方便。 2.2.2 工程图件的矢量化 因工程领域图件处理多使用 AutoCAD,所以工程图件使用 AutoCAD 进行矢量化,方法步骤与地形地质图类似,在此不赘述。 3 电子档案资料后期处理工作 电子化的档案资料为方便管理及二次开发利用,应对其进行分类、建库、建档。 3.1 分类 一般性档案资料按成果资料、原始资料、实物资料进行分类;地形图的电子化管理应对地形图按图幅进行分类;地质图等专题图件可按专5题分类或按矿区分类。分类的好处一是避免不同档案工作人员重复矢量化;二是方便资料提取,查阅。 3.2 建库 扫描及电子化处理后的档案资料多而乱,为方便管理,应按档案号进行建库,并及时加载进地质资料管理系统,方便档案资料查询和利用。3.3 建档 对分类好并建库的档案资料,按题名建立档案目录,避免不同时期、不同档案工作人员重复工作,也可方便技术人员搜索、查阅、利用。 4 结 语 档案资料的电子化工作看似简单,但是要做好这项工作,就需要掌握电子化工作的方法及上述软件的使用技巧。做好档案资料的二次开发利用,除做好档案资料的电子化工作,还需要做好电子化档案资料的管理。