1、1基于课程的“学习资源中心”平台建设研究摘要文章通过对天津市高校联合书目数据库质量的分析,探讨了书目数据库存在的质量问题及原因,并从数据规范控制、数据质量管理体系、系统改进等方面提出了控制书目质量的建议和措施。 关键词联机编目;书目数据;质量控制;Unicorn 编目系统 DOI:10.3969/j.issn.1008-0821.2013.05.031 中图分类号G25074文献标识码A文章编号1008-0821(2013)05-0138-05 天津市市属 17 所高校图书馆于 2002 年组成高校图书馆联盟,联合引进美国 Sirsi 公司的 Unicorn Consortia 图书馆自动化管
2、理系统,采取使用一个服务器,在同一平台上办公的工作模式,以实现对图书馆日常业务的全面管理和文献信息资源的共享共建。而这个管理系统建设的关键是联合书目数据库,它是该系统安全运行的基础和核心。 各成员馆在同一系统平台上的联机合作编目避免了大量的重复劳动,降低了编目成本,提高了编目效率。做到了优势互补、提高了编目的一致性、标准化和规范化。由于每条编目数据都上载了各馆的索书号、文献标识及馆藏信息,它就完全支撑了图书馆全部传统业务的正常运行,包括采访、检索、流通、阅览、预约、续借等,真正实现了一馆式垂直管理模式,也最大程度地实现了编目的共知共建共享。因此联合编目的优势与重要性就决定了联合书目数据库必须要
3、以高质量的编目数据为依2托。但从目前情况看,数据库中编目数据质量仍参差不齐,存在较多问题。对数据质量问题的分析和解决,将有利于天津高校联机合作编目的继续开展和文献信息资源的共建共享。 1 联合书目数据库质量问题分析 目前,天津高校图书馆联盟主要是用 Unicorn 编目系统和 CALIS 的Z3950 软件实现联机编目。Unicorn 联机编目模块采用的是书目数据三级结构管理方法,即同一种书共享一个题名和数据,各成员馆在同一个书目数据上建立各自的索书号和复本信息,如图 1。 目前,天津高校联合馆 90%以上的数据是可以从 CALIS 上下载并套录。对于 CALIS 上没有的数据大多数的图书馆通
4、常采用两种方式来建书目数据:一是采用书商提供的数据,即外包数据;一是图书馆自己进行原始编目。 11 原始编目数据的质量问题 132 对多卷书、连续出版物等集中、分散著录处理方式不一致 对于多卷书和连续出版物,一般情况下是按照集中著录形式进行的,但是在 Unicorn 系统中,这种类型的书有的集中著录,有的分散著录,由于没有严格的约束机制和责任问责,各成员馆在处理时随意性很大,造成了严重的重复数据。如中国商务年鉴一书,从 2004 年卷开始,每年出版一卷,理论上应该集中著录,但在系统中,该书就存在 5 条数据,分别为中国商务年卷 2005 年卷、2006 年卷、2007 年卷、一条集中著录的数据
5、和一条残缺的垃圾数据。 133 套录数据时处理不当 3在 Unicorn 系统中,经常会存在同一馆同一条数据下载多次或数据下载有误造成重复数据,直接的表现形式是一种书存在多条数据,但只有一条数据有馆藏,其余都是既无馆藏又无采购订单的空数据或残缺数据。 另外,在借用相似数据改为新数据时不按现编书修改也造成了重复数据,比如借用 1 版书数据改为 2 版时,只在新数据添加了版次,其余像 ISBN 号,页数,出版年、丛书等关键字段都不修改,或者数据中定长和非定长字段的两处出版年,只改一处。但是在系统中凡是需要系统自动选择出版年时,系统对西文选择的是上边定长字段的出版年,对中文选择的是下边数据字段(21
6、0 字段)的出版年,如果系统选择的恰好是你没改的,系统就会显示是重复数据。 14 垃圾数据问题 垃圾数据主要是指残缺数据、空数据等书目信息不完全、缺少必要的信息点、无馆藏信息的数据。人为、系统的原因都可能导致垃圾数据的产生。如有的数据是缺题名的数据,这样的数据在题名字段统一显示为:REQUIRED FIELD 字样(意思是说题名是必备字段,现在是空的) ,这种数据的产生大致有 3 种原因:一是对 Unicorn 系统的编目模块不熟悉,对系统属性的设置与要下载的数据格式、文种不匹配造成的;二是做数据过程中由于各种原因造成的网络掉线或系统突然退出而产生的缺题名数据。以上原因产生的缺题名数据多数情况
7、下显示的其他字段也很少,这样的数据在系统内有的永远也检不出来。在系统里形成了垃圾数据。 2 联合书目数据库质量控制的措施 421 书目数据的规范控制 文献著录规范是保证书目数据库质量的重要因素,著录的一致性、惟一性,可以提高读者检索的查全率和查准率,同时又是文献工作标准化的基础。规范控制是为确保标目在检索系统及书目系统中的惟一性和稳定性而建立、维护、使用规范款目和规范文档的工作过程。规范控制应始终如一地使用和维护统一的名称、题名和主题等规范形式。从天津高校图书馆联盟成立至今,先后使用过 OLCC 标准、自定义标准到现在的CALIS 编目标准,在联盟几次变更编目准则的背景下,是各成员馆为追求编目
8、效率而导致的对规范控制的忽视,尤其是在对标目形式的选择上缺乏严格的控制手段,这已成为进一步提高书目数据质量的瓶颈问题。 在目前联机编目环境下,联盟管理中心应该尽快进行规范控制、制定一系列详尽的编目细则,特别是对年鉴、多卷书、连续出版物等特殊图书著录的规定。例如,现在进行编目时依据 CALIS 标准,所以对年鉴、多卷书等一般严格依据规则进行集中、分散著录,但编目员在实际操作时发现应该集中著录的数据已经单独著录时怎么做,多卷书卷册太多时怎么做(卷册多会产生太多索书号,在同一数据上添加太多索书号容易导致系统界面死机) ,碰到重复数据时怎么做,碰到问题数据时怎么做将这些编目员平时经常遇到的问题整理成册
9、,给出具体的规定并发放各成员馆,这样就能解决成员馆在遇到问题时无所适从或自行随意解决的问题。只有对编目细则进行统一,才能使编目工作有章可循,使编目数据更为标准化和规范化。 22 建立严密的数据管理和质量审核体系 在联合编目的背景下,一条问题数据的出现将直接影响联盟 17 个成5员馆的使用,所以其质量问题就显得尤为重要。而对数据质量的管理和维护除了各成员馆认真负责外,管理中心的全局布控和管理也不可缺少。目前,中心采取随时检查问题数据、向相应馆反馈信息、日常业务辅导、年底评价总结等措施来控制质量,这些措施固然起到一定的积极作用,但仍未能改变数据质量参差不齐及数据重复的现象。笔者认为,这些措施不够强
10、硬,奖惩也不够分明。中心在进行管理时,应首先从源头堵住问题数据的产生,同时使用硬性的管理手段,建立严密的校对检查程序,并引入奖惩机制。 221 设置相应的编目权限 目前,成员馆在同一个系统平台上办公,系统对各种数据的提交和修改没有设置任何标准和权限限制。成员馆中,就算没有经过任何培训的新人都可以随便上传和修改数据,这种对编目权限的完全放开是造成数据库中问题数据的一个重要原因,也是中心今后应注意和改进的地方。笔者建议效仿 CALIS 联机编目的经验,对成员馆编目数据的上传和修改作相应的等级和权限设置。给各个成员馆编目人员进行培训考核,成绩合格的编目员才拥有上传数据的权限,新人和不合格的编目员编制
11、的数据需要经由本馆合格编目员审核后方可上传。这样才能保证系统中原编数据的质量,也可以调动编目人员的积极性和上进心。 222 建立严密有效的审校管理体系 要形成一套严格有效的审校管理体系,需要有严密的校对审查程序,并引入奖惩机制。使用硬性的管理手段,把质量控制量化,即把书目数6据的差错率数字化,使它与成员馆编制的书目数据的质量有机结合起来,并依此来对成员馆进行排名和奖惩。 对书目数据进行质量控制与评价的一个重要指标是书目数据差错率,它反映了书目数据著录格式是否标准、内容是否准确全面,通过计算书目数据差错率能够客观、科学、公正地评价数据质量。 223 建立培训互动和反馈系统 编目人员的素质直接决定
12、着编目数据的质量,因此,中心和各成员馆应采取各种积极有效的措施调动编目员的积极性,提高其专业能力和综合素质。加强编目人员的业务培训、继续教育,定期开展编目员的业务培训和讨论会,鼓励他们多与同行进行交流和探讨,以加深对细则的理解,及时传达新信息,使数据的统一性和差错率随时处在可控之中。另外,也可以用网上答疑的方式加强专家和编目员之间的联系与交流,共同提高书目数据的质量。同时建立反馈系统,在中心网站开辟专栏,对编目中产生的各种问题进行收集、整理与分析,整理成书目资料并通晓各馆,从而让编目数据的质量达到最佳。 23 合并重复数据、清理数据垃圾 天津联机编目中心到今天已经成立将近十年,由于各种主客观原
13、因,书目数据库中现有很多重复记录或残缺不全、无法有效利用的垃圾数据,当这些数据累积到一定程度时,就会影响书目数据的质量和有效利用。因此联编中心应联合成员馆集中处理下系统中的历史遗留问题,并逐步将数据记录的清理、去重、合并发展成书目数据维护工作的常规业务。 24 充分利用并积极开发改进软件系统 7241 设置系统编目权限 上面提到的设置相应编目上传和修改数据的权限设置问题最终需要靠系统来解决,2013 年升级前的系统对各种数据的提交没有设置任何权限,各成员馆甚至可以随意修改他馆的馆藏信息。从 2013 年 3 月开始,Unicorn 系统全面升级,升级后的系统增加了中文、俄文和电子资源的编目模块
14、,对原来中西文图书编目模块也进行了一些改进,如随意修改他馆馆藏信息的现象已不复存在,但对编目数据仍然可以随意修改。中心可以联系系统开发商,对数据上传修改的权限也进行相应的设置升级。 242 完善系统自动纠错功能 应积极开发完善软件的自动校验和纠错功能,提高系统自动判重的能力。对于某些对应性字段和常见的错误,系统可进行自动匹配检查,提供报错提示服务。同时改进和完善规范控制功能,支持名称规范控制工作的顺利开展,加紧调研数据维护升级程序,从而保证书目数据库的数据质量。 243 充分利用系统报表查错 Unicorn 系统的报表模块具有强大的统计功能。其独特的报表实用程序可以实现传统编目方式下编目员必须
15、手工完成的一些技术加工项目,比如列出索书号、列出书目记录、文献统计等工作。根据需要设置各种选项信息后,就可以根据报表运行的结果查看最近的编目数据有无错误。定期对每批次编目数据进行报表统计检查,可以很大程度上提高编目数据的质量。 3 结语 8天津市高校图书馆联合书目资源共享系统采用集中式的管理方法,即由多个图书馆共同建设和维护同一个联合书目数据库。这是对原有的单馆编目模式的变革,极大提高了图书馆编目的共建共知共享。目前,天津高校图书馆联盟对图书资源的共建共享部分做法是编制图书联合目录数据库,后采用馆际互借的方法实现图书资源共享这一过程,但协调采购、统一采购工作做得较少,使得各成员馆重复采购现象比
16、较严重,在一定程度上造成了资源浪费,也造成了编目的重复性工作。造成这种现象的原因一方面是对各馆经费管理无法协调,另一方面也还没有解决好原文传递困难、读者到他馆进行馆际互借过于麻烦等问题。所以,图书资源的共建共享工作要真正起到实效,必须要从管理理念、技术手段到服务范围都有所变革,真正建立起“大图书馆”理念,使图书馆联盟成为真正意义上的一体化图书馆,做到从采到编、从技术到服务、从实体资源到虚拟资源的全方位共建共享,更有效地促进天津市高校图书馆联盟的建设和发展。 参考文献 1黄雪梅,史永强,王南.天津市高校图书馆书目资源共享系统的模式与功能J.河北科技图苑,2003, (6):12-13. 2陈艳梅
17、.高校图书馆书目数据的质量控制刍议J.图书馆学刊,2007, (4):105-106. 3周小敏.联机编目书目数据质量问题探析以全国图书馆联合编目中心数据为例J.图书馆论坛,2010, (8):115-117,104. 4陈新洁.图书馆编目外包质量控制与绩效评价研究J.图书馆论9坛,2011, (8):132-134. 5杜欣明.技术干预模式:编目业务外包的一种新尝试J.图书馆建设,2011, (3):108-110. 6王龙.数字化视域下图书馆书目数据质量控制探讨J.中国报业,2012, (4):235-236. 7李智.我国书目数据标准化面临的主要障碍J.图书馆建设,2012, (6):31-32,35. 8丁建勤.联机联合编目成员馆编目绩效评估及其分析J.图书馆建设,2012, (8):21-23,37. 9易向军.联机编目环境下书目数据规范控制研究J.中国图书馆学报,2011, (11):120-124 (本文责任编辑:孙国雷)