1、1数字信息资源的深度整合与利用研究摘 要:信息资源的整合与利用是图书馆信息化建设中极为重要的内容。从图书馆信息资源面临的问题入手,重点从利用率低,资源分散,相互独立、重复建设等方面进行了分析,结合信息资源整合利用的原则,提出了如何在“深度”上下功夫和促进信息资源整合与共享的对策和建议。 关键词:图书馆;信息资源;整合;利用 中图分类号:G250.7 文献标志码:A 文章编号:1002-2589(2013)24-0202-02 如何改变信息重复采集、分割拥有、垄断使用和低效开发的局面;打破数据格式多样,没有统一标准规范的现状,信息资源整合就成为图书馆面临的首要问题之一。 一、国内外信息资源整合平
2、台性能比较分析 信息资源整合需要借助特定的软件系统来实现,国内数图软件虽然不少,但具备资源整合功能并经过实际应用考验且成熟的产品并不多,目前国内主要平台有北京拓尔思 TRS、清华同方 TPI、北京金信桥 TBS、北京方正德赛、武汉天罡公司 XdocII 等。另外还有一些高校图书馆自行开发的系统,如深圳大学开发的 SULCMIS 图书馆自动化集成系统等。它们都有信息资源整合的机制等功能。而现阶段国内较为成熟而且在市场中占有较大份额的是 TPI 和 TRS 平台1。TRS 资源整合门户支持不同目2标资源的特定检索条件,个性化服务及统计功能较强,可以提供多种全面的检索结果输出格式。TRI 检索结果显
3、示方式多样,支持重新检索和二次检索,比较适合中小型图书馆进行资源整合的需要。它们为图书馆信息资源整合等方面提供了相应技术,奠定了良好基础。 国外针对数字图书馆建设所提供的资源整合功能的数图软件产品发展较为成熟也较为完善,但目前引进到国内的只有 Metalib/SFX2。它作为目前世界上用户最多的资源整合软件平台和首家在中国大陆设立代表处的同类国际软件,发展势头较快。2005 年以来先后被国内若干有影响的用户(如国家图书馆、清华大学图书馆、复旦大学图书馆等)购买和使用,有着能够提供整合的强大功能。然而,它的价格会使大多数用户望而生畏。 从国内外数字资源整合系统比较分析可以看出,清华同方的 TPI
4、 系统和北京的 TRS 的资源整合门户相对较为成熟,用户也较多。但在资源整合功能上还存在着差异。尽管 TPI 产品在整合功能上提供了丰富的内容导航和深度的知识挖掘服务,但实用效果有一定的局限性;TRS 提供个性化服务,但整合手段较为单一。Metalib/SFX 作为国际著名的数字图书馆软件品,其整合形式和技术运用相对成熟,尤其是其构建完备的知识库的整合方法值得国内产品借鉴。 二、图书馆资源整合的主要模式 信息化建设整合资源,能够发挥各自优势,相互促进,共同发展,充分挖掘自身的潜力,不断拓展合作渠道,推动合作向更高层、更深入、更有效的方向发展,图书馆信息资源整合的主要模式大致可分为数据整3合和知
5、识整合,也有文章提出是虚体整合和实体整合。 1.数据整合。数据整合就是指信息资源数据在逻辑上或物理上的合并。这种形式仅表现为信息资源数量上的变化,数据之间并没有关联;这种形式是对异构资源系统中的异质、异类的数据在逻辑上或物理上有机的集中,提供统一的表示和操作,以解决多种异构数据资源的互联与共享。数据整合的内容包括,数据库整合、系统平台整合、数据聚合、数据互操作等。这种方式是将多个异构的数字资源系统集成为一个统一的数据视图,简单地说,也就是把用不同技术、在各个时间开发的、具有不同内容和形式的数字资源系统聚合在一起,消除异构资源系统间的差异,呈现给用户一个统一的检索界面,应用信息系统集成平台,将来
6、自于不同的操作系统、开发平台和数据库的各类资源和应用系统集成在一个高效、智能化的统一平台上,提供一个跨越多种分散的、内部和外部的信息处理过程的集成纽带,把这些信息整合到一起,使用户可一次集成检索多个数字资源系统,达到异构数据的共知和共享。 数据信息资源整合的模式中还包括基于联机公共目录查询系统(OPAC) 、基于导航系统、基于链接系统和基于跨库检索系统的数字资源整合。统一检索无疑是资源整合工作中的关键需求,即通过各自的标准协议接口/网关,对信息源进行“即插即用”式的统一管理。数据整合的作用在一定程度上解决了异构数据的共享和互通的问题。它可在一个统一的界面上进行快速的资源统一检索,为以后的资源共
7、享打下稳固的基础。满足现行图书馆信息资源建设、管理、服务等需求。信息资源整合的关键是如何利用平台构建和管理自己的门户网站,规划构建自己的各4种特色数据库,并有计划、有步骤地将自己的信息资源进行加工整序,整合,给读者一个更方便获取知识的途径,更人性化的服务,以使数字图书馆技术和模式得到有效的利用。 2.除了数据整合外,知识整合也是信息资源整合的重要部分,它是在数据整合的基础上,对信息资源的更进一步、更深层次的优化、整合。它侧重于概念和关系(本体)的重组,是利用知识本体,通过对某学科数字资源的分解重组,按知识体系的关联性、主体性组织成网状相互联系的知识资源整合系统。知识本体是反映概念及概念之间关系
8、的知识系统,这种整合模式的作用是:(1)知识本体提供对领域知识的规范描述和共同理解,并对这些知识进行重复使用,而达到知识共享的目的。(2)知识本体使不同领域的知识体系化、结构化,为实现数字资源的整体化、一体化的共享奠定基础。例如研究知识的分布式存储体系结构,使得知识分布式地存储在计算机网络中,形成既独立于每个知识,又能被多个知识发现、重新结成为一个新的共享的有机整体,形成一个效能更好、效率更高的新的信息资源体系。 图书馆从传统的纸质文献为主的采集策略逐渐转向面向用户需求、以数字资源为主体的多元化、开放性知识保障格局,其内涵和外延已经开始发生了深刻变化,不断加强知识服务功能是图书馆面向未来的新的
9、挑战。如何构建知识本体,有效的方法是构建知识交换平台,以现有本体为基础构造出新本体,使异构的知识能够互通有无,交换共享。但由于传统分类法与主题词表中的术语是规范的、知识点是线性的、缺乏对所应用资源的针对性等不足,因此在将其应用于数字图书馆的知识组织5时,需要进行组织和改造。这就要进行知识挖掘,对于现有信息知识中的隐性知识进行知识发现和挖掘,包括深层次的数据挖掘、文本数据挖掘、文档数据挖掘等。基于知识体系的资源整合,就是创新知识的过程,就是进行科学的计划、组织、协调和揭示,从而有效地保证知识组织目标的顺利实现。 数据整合和知识整合这两种方式在实践中并不是相对独立的,它可以是以某一种方式为主并同时
10、与其他几种方式一起,可以是相互交叉又相互重合的、有主有附的几种方式。模式的确定可以有:(1)汇合方式。 (2)组合方式。 (3)重组方式。 (4)一体化综合方式等。图书馆可以根据本馆的具体实际情况来决定采取某一种或某几种层次的整合方式。做好了这一步,就为今后的合作共享打下了良好的基础。 三、资源整合重在“深度” 如何在深层次上下功夫,专业人员应在对信息资源组织、筛选、分析、整合的基础上,提炼出融入专业人员智慧价值的知识集合,即知识组织和知识创新,从而有益于用户内化知识并自主创新,图书馆应利用专业优势和核心能力对接受与收集的信息资源进行科学组织、加工整合、深度揭示。 但是,当前图书馆建设中的资源
11、整合值得忧虑,大多数还停留在较浅的层面上。例如,很多图书馆资源实现的只是一种“界面”层次上的整合。虽然在开始提出要“统一规划” 、 “深度揭示” ,但在实际操作中,往往采用一些“权宜之计” ,这些资源并没有形成服务的“合力” ,管理或服务的效率并没有多少改观。例如协调不了信息的共享,那就以我为6主,再采集一次;业务流程不想变化,那就任由先进的信息技术与落后的人工处理相互交错、和平共处等等。这些临时性的做法,往往使得最初向往轰轰烈烈的“信息资源整合”成为一句空话,相反还更进一步恶化了信息资源环境,为真正的“整合”留下难啃的“骨头”3。 深层次的整合是全面的深度的整合、知识的组织和创新的整合。它的
12、特征是:在特定领域或管理范围内有总体规划,技术与基础设施等实现较好融合;实现信息的无重复采集、充分共享、统一管理和综合利用的开放性平台。知识整合就是在资源整合的基础上对信息资源的深度整合。就是如何对馆藏资源实现基于语义的知识组织和知识服务,通过深度聚合和可视化手段,针对用户需求提供准确、有效的知识服务。一方面,馆藏资源中不同语种、不同载体形式、不同来源的资源之间需要建立有机联系;另一方面,日益丰富的数字资源包含着语义丰富、学科各异、实体多样的知识资源,需要利用多种途径、多种方法和多个界面来进行揭示、关联和检索,以利于用户对信息资源的有效获取和知识内容的共建共享。因此,如何对馆藏资源进行深层次的
13、揭示、聚合、展示和共享,成为图书情报界关注的热点问题。 还要在国际和国家标准指导下,根据本部门的实际情况制定规范的标准,做好承上启下数据的接轨。还应把握著作权合理使用的规则、范畴和尺度,根据版权法的不断发展来不断调整合理使用的范围和限度,使图书馆信息资源整合控制在合理合法利用的范围之内。对科研项目的深入和发展有潜在作用的需求,图书馆也应通过启发、转移、延伸等服务手段去满足用户并做好延伸和扩展服务。因此,由国家图书馆牵头,7各级公共图书馆形成合力,达到信息产品的整合则显得尤其迫切,通过资源共享、优势互补、实现共赢的目的显得尤为重要。 四、图书馆信息资源协作整合与合作共享前景探讨 我国图书情报界对
14、图书馆资源整合与共享还存在许多问题。比如在建设方面还没有统一的全面的规划,缺乏权威性的统一软件、统一的管理及调控指导机构,标准化程度不高等。诸多因素使图书馆资源整合建设各自为政、自行发展,影响了资源的共享。国内相关研究在重视对国外整合方法和技术引进的同时,缺乏对图书馆如何在实践中的实施和具体应用的指导。不同的数据库之间的内容交叉重复,没有实现整个流程的自动化和数字化;没有形成有效的全局性支撑平台,对信息资源和业务流程不能进行按需配置和优化等,这就影响到用户对信息的选择与获取。目前数字信息资源从制作到购买还都存在着大量重复建设问题,如在我国的学位论文数据库中,就有中国学术期刊电子版的中国优秀博硕
15、士学位论文全文数据库和 CALIS 的高校学位论文库以及万方的中国学位论文数据库 ,它们之间有很大一部分是重复的。这些重复的数字资源给信息的选择带来了很大的麻烦。 信息资源协作整合与合作共享需要整个公共信息服务平台建设的支撑,在技术上包括了整合平台、安全平台、系统支撑平台等。通过基础架构平台完成门户、数据、应用、流程和知识整合,实现信息资源的合作共享、交换和协同知识服务体系。从业务角度说,应当按照“统一标准规范,确定基础数据和建立统一门户认证”的原则来整合数字化信息资源、技术资源、培训资源,构建全新的资源模式,实现资源共建,完8善数字化信息资源系统和共享机制,尽快制定和完善数字信息资源共建共享
16、共同服务等方面的法律法规,打破传统各部门数字信息资源的垄断,建立统一的数字信息交换模式。 对“信息资源整合”应该达到什么效果,采用什么样的形式、什么样的程度以及不同方面的信息资源整合的理解可谓见仁见智。数字资源协作整合与合作共享服务是一项系统的工程,在建设过程中,要协调发展,大力合作,总体规划,长远布局,应尽可能选择同一检索平台4,并尽可能利用数据整合的平台和数据资源,同时采用规范的标准框架体系;使横向整合的一体化组织形态取代各自独立的分布式部门设置,优化资源利用环境,满足用户需求。在整合数字资源的组织上,要实现各种数字资源要素的结构性优化;在类型上,要实现无缝链接;在载体上,要实现各个特色数
17、据库网络信息资源的并轨;在基础上,要推出集成化的主动信息服务,其中包括自定义的检索服务、主动的信息发布服务、智能化的检索代理服务等,加大对文献信息资源的整合力度,注重对信息资源开发、利用的标准化工作,不断提高信息服务的质量和水平,达到知识共享。如果范围大的整合与共享困难较大,就先从不同类型、各自系统图书馆开始,比如,公共图书馆系统、大学图书馆系统、党校图书馆系统等。先纵向开展,待时机成熟再向横向发展。通过对各馆资源的整合,达到 1+12 的效果,使整体大于局部之和,从而以最小的成本最大限度地满足读者对信息资源的多元化需求,来实现数字信息资源的可持续发展。 参考文献: 91郑新.试论数字图书馆信息资源建设J.知识经济,2012, (19). 2龚亦农.TPI、TRS 和 Metalib/SFX 三种数字图书馆软件系统的资源整合功能比较分析J.新世纪图书馆,2007, (3) 3唐志明.信息资源整合的“深度”EB/OL.新浪博客,2010-04-27. 4任浪.地方高校图书馆数字信息资源整合和服务平台建设探讨J.科技情报开发与经济,2012, (21).