精选优质文档-倾情为你奉上论古籍整理自动化北京大学中文系 李铎信息科技在古代典籍的整理方面,经历着三个阶段。一是数据文献的录入。八十年代,台湾中央研究院率先录入整理重要的古代典籍。由于大陆较早使用的GB2312汉字系统仅支持6763个汉字,且不支持繁体,所以,大陆在文献的整理上仅限于现当代文学作品、大型报刊等。自96年WIN95支持CJK以来,大陆纔开始启动这方面的工作,但大多数仍处于计算器加手工作坊的阶段,即人工录入。九十年代末香港迪志公司与北京书同文公司联合开发四库全书,使用非特定人手写识别系统,极大的节约了人力物力。仅两年多的时间,我们就可以使用四库全书这部近八亿汉字的丛书了,后来书同文公司又开发了四部丛刊近一亿汉字的古籍数据库,目前该公司又着手四部丛刊的四编整理。二是文献的检索。一旦整理出古籍文献,它就进入了使用阶段,对于小量的文檔,就可以直接在自己的WORD中使用检索,查找需要字词,如果会使用VBA,还可以编辑引得、关联相关的数据库等等。如果是海量数据,可以使用特定的检索平台,甚至可以直接对数据库操作。还有多种的搜索引擎用来搜