1、1高校图书馆大数据时代数据建设及功能转型探析摘要大数据是科学进步的产物,是高校图书馆的重要资产,也是服务转型的基础。大数据具有全面性、多样性和时效性的特征,预测和优化是大数据的核心。高校图书馆的大数据的形成、存储和应用有其特点。大数据时代下高校图书馆应加快服务转型,转型的关键在于资源整合、语义分析和移动终端等 3 个方面。 关键词大数据;知识服务;资源整合;语义分析;网络平台 1 大数据是现代网络技术的必然结果 由于互联网、3G 网络和物联网等各种信息网络的快速发展,PC 端、移动终端、RFID 和无线传感器等各种终端的广泛使用,Hadoop 平台、数据流分析、云计算等网络技术的不断成熟,产生
2、于各种终端的数据急剧膨胀。这些数据如此之大,存储方式如此之复杂,人们就用大数据来形容这些以 TB 计量的信息数据。通常人们用 4V 来描述大数据的特征2,即体量巨大(volume) 、形态繁多(variety) 、生成速度快(velocity) 、价值大但密度低(value) 。这是对大数据的量级、储存方式、处理技术和利用价值等方面的描述。 对海量数据进行筛选分析,挖掘出有价值的信息,才是大数据的真正本质。从价值发现的角度来看,大数据具有全面、多样和实时的特征。1.1 大数据是全面的 2大数据的全面性反映在两个方面。一方面,几乎人类社会的各个方面都有大数据的存在和使用,从电子商务、网络教育到政
3、府微博等,大数据无所不在、无所不包;另一方面,大数据为单一个体提供了历史数据、同类比较等比较全面的描述。对大数据来说,样本即总体。大数据的全面性能对事物的本质和行为者的意识做出比较客观的判断,能对事物的未来发展做出比较准确的预测。 1.2 大数据是多样的 大数据的多样性表现在两个方面。首先,产生和储存大数据的形式呈现多样性,功能不同的数据终端生成的数据在形式上也各有不同,有文本、图像,还有各种无线信号,从存储形式上看,这些数据有结构化数据、非结构化数据和半结构化数据;其次,大数据产生的价值是多方面的,同样的大数据由于参数选择的不同,观察角度的不同,会产生不同的价值,例如,同一组销售数据,对生产
4、厂家和对物流公司来说,其价值是不同的。大数据的多样性特别是形态的多样性,可以对事物进行直观的多维度的描述,可以从数据中挖掘更多的价值。 1.3 大数据是实时的 由静态发展转向动态发展将成为信息发展的主流。大数据最重要的特征就是数据的时效性。大数据的时效性也包含两个方面。一方面,数据的产生是实时的,由于产生大数据的各种终端不断地实时地产生数据,如网络访问中的日志数、商品的二维码扫描、通讯信息等,特别是随着移动终端采集数据的技术的更新与进步,大数据的时效性更为突出;另一方面,大数据的处理是实时的,云计算和 hadoop 等网络技术为大数据3提供了实时的处理。 大数据的上述特征,使大数据蕴含着巨大的
5、价值。 Big Data-A Revolution That Will Transform How We Live, Work and Think一书的作者 Viktor Mayer-Schonberger 认为大数据的核心就是预测和优化。Google 公司开发的自动驾驶汽车运用了视频摄像头、雷达传感器和激光测距器来收集实时的数据,了解周围的交通状况,并通过详尽的地图对前方的道路进行导航,这一切都是通过 Google 的大数据中心来实现的。Aamzon 的推荐引擎也是运用大数据的成功案例,其推荐引擎完全是基于客户在过去一段时间的购买行为所做的:客户的购物车中所收藏的商品、客户喜欢的商品、其他用
6、户浏览或购买的商品Aamzon 使用大数据平台,为每位客户定制了专属的个人主页,利用这一策略,公司在其第三财政季度期间销售增长 27%,达到了 1318 亿美元,而去年同期的销售额则为 96 亿美元。从这些经典的案例中,我们可以展望大数据对高校图书馆所产生的巨大价值。 2 高校图书馆的大数据建设 大数据特别是非结构化数据和半结构化数据将成为未来图书馆的重要资产3。高校图书馆的大数据资源包括图书馆的纸型资源、数字资源、网络资源和客户资源。 2.1 纸型资源要加快数字化建设 图书馆的纸型资源是所有纸介质信息的总和,包括图书、期刊和报纸,它是高校图书馆的大数据资源的基础。为适应大数据时代的发展趋势,
7、未来高校图书馆应该将纸型资源与数字资源结合起来,纸质资源与4数字资源互补共存,并且数字资源要逐步成为图书馆的主要资源,而纸质资源要逐步数字化,为在线阅读和资源整合提供数字化基础。 2.2 数字资源要进一步整合 图书馆的数字资源包括数据库、电子期刊、电子图书、网页和多媒体资源。资源整合是高校图书馆发展的基础工程,包括高校内部的资源整合,高校之间的资源整合和各类数据库的共享等。资源整合可以提高现有资源的利用率,最大限度地满足读者的需求。目前已有的基于 OPAC的数字资源整合是资源整合的初级阶段,主要是查阅功能和数据库的整合,未来还要加快客户资源、数字化了的纸质资源、教学和实验资源的整合,尽可能消除
8、时间和空间的影响。高校图书馆的资源整合是大数据环境下的内在需求,同时大数据还可以为资源整合提供必要的数据和技术支持4。 2.3 网络平台是大数据的载体 高校图书馆的网络平台是大数据的根基,是生成、存储和交换大数据的重要载体,是图书馆与客户互动的重要平台。高校图书馆建立网络平台拥有自己特有的优势。 2.3.1 实体优势。经过多年的积累和完善,高校图书馆积累了大量的图书和期刊,其品质和专业性也逐年提高,这就能为客户提供更多的和更便利的选择,这种实体优势是其他只提供虚拟的知识服务和信息服务的网络平台所无法比拟的。 2.3.2 客户优势。高校图书馆的服务对象主要是在校学生和教师,客户群相对稳定,因此对
9、客户信息的认知程度非常高,这些信息包括客5户的个人信息、专业取向和知识水平等,对这些信息的掌握可以使图书馆在服务环节上做到细分,从而为客户提供更准确和更高效的知识服务。2.3.3 管理优势。高校图书馆一直处在知识信息的最前沿,对图书的质量和需求、最新的图书信息、知识服务的新进展等都更加了解,可以为客户提供更及时和更前沿的图书信息。高校图书馆的管理人员和技术人员的专业水平高,管理经验丰富,这是图书馆提供优质服务的不可或缺的软实力。 高校图书馆应根据自身的优势和需要建立更具特色的网络平台,使其成为信息更加丰富,资源更加全面,搜索更加便利,个性化更加突出的平台,成为图书馆与客户连接的重要窗口。 3
10、大数据促高校图书馆的功能转变 大数据时代下高校图书馆的服务功能将产生新的变化。除了要继承和优化传统的服务功能,也要开发大数据支持下的新的服务功能。 3.1 实体资源的跨区域整合 图书馆的最大优势是它的实体资源,实体资源的整合可以进一步优化资源配置,最大限度地满足客户需求。高校图书馆的服务对象有明显的区域性特征,在当地图书馆和购买行为无法满足客户的阅读需求时,跨区域的实体资源的重新配置就显得非常必要。大数据也伴随着大物流,在物流相当发达的今天,图书馆实体资源的整合成为可能。高校图书馆应建立跨区域的图书联盟,建立跨区域的无偿或有偿的图书预约机制和图书调配机制,建立便利、可信、智能的图书物流平台。
11、3.2 专业化的客户服务 6在高校图书馆的网络平台建设中,提高搜索引擎的个性化和智能化是关键。目前高校图书馆已经提供了许多数字资源5,包括CALIS、CADAL 等数据库,也提供了许多个性化服务,但由于受到技术方面的制约,现有的搜索引擎和语义分析还无法完全满足客户的搜索意图,搜索的结果往往是机械的和被动的,客户在提供的搜索数据面前,只能自己去筛选信息。如果一个教授与一个新生得出的搜索结果是一样的,显然违背了客户的搜索意图。大数据的全面性和多样性为图书馆提供了比较详细的客户的信息,包括客户的专业信息、借阅行为、网络浏览记录等,这些信息为图书馆开发优质、智能、提前的服务提供了可靠的依据。建立在大数
12、据平台下的搜索引擎,可以根据客户的搜索历史以及浏览习惯等数据进行分析,根据本体知识的来源、演化过程、知识间的因果关系和关联知识进行判断,将数据进行深加工,从而使搜索结果变得立体和科学,能充分满足用户间差异性的需求。 3.3 移动终端的信息服务 大数据时代的一个重要标志是移动终端的广泛使用。手机以其方便快捷、碎片化时间的阅读优势,将成为今后阅读的最主要的方式之一。据第十次全国国民阅读调查报告6,2012 年我国 1870 周岁国民人均每天手机阅读的时长为 13.53 分钟,比 2010 年增加了 3.21 分钟,在大学生群体中手机阅读时间远超这个数字。高校图书馆应为客户提供更多的针对移动终端的资
13、源,通过短信等方式发布有关专业的信息,开通手机的订阅服务功能等。建立移动终端的个人图书馆是图书馆服务功能转型的重要环节。 74 结语 大数据的来临,是科技进步的必然结果,它在给传统的高校图书馆带来挑战的同时,也带来了机遇。只有正确认识大数据,深度挖掘大数据的价值,完善大数据技术,高校图书馆才能在大数据时代下得到发展。只有改变服务理念,了解客户的需求,掌握专业进步的需求,提高服务品质,高校图书馆才能实现服务转型。建立在大数据平台下的高校图书馆,是未来高校图书馆发展的必然趋势。 参考文献 1 李福林.联合发展,应对图书馆边缘化J.情报探索,2009(1):1011. 2 李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域大数据的研究现状与科学思考J.中国科学院院刊,2012(6):647657. 3 杨海燕.大数据时代的图书馆服务浅析J.图书与情报,2012(4):120122. 4 严霄凤,张德馨.大数据研究J.计算机技术与发展,2013(4):168172. 5 龚亦农.数字图书馆的资源整合J.图书情报工作,2005(9):121123. 6 中国新闻出版研究院.第十次全国国民阅读调查报告EB/OL. 2013-07-27.http:/www.chuban.cc/yw/201304/t20130419_140027.html.