1、1面向科研用户小数据的微知识服务研究(上)摘 要:在“互联网+”环境下,泛在互联为科研用户小数据的获取以及微知识服务的推送提供了便利。文章首先介绍了科研用户小数据的内涵,辨析了科研用户小数据与小科学数据的关系。在此基础上,分析了科研用户小数据与微知识服务的契合性,据此重点探讨了面向科研用户小数据的微知识服务模式及其典型特征,以及需要进一步注意和解决的问题。 关键词:小数据;科研用户;微知识;知识服务;科学研究 中图分类号: G250.7;G252 文献标识码: A DOI:10.11968/tsyqb.1003-6938.2016040 Study on Micro-knowledge Ser
2、vice Based on Small Data of Researcher (I) Abstract It is convenient to access the small data from researcher due to ubiquitous interconnection in the context of “Internet +”. This study firstly introduces connotation of small data of the researcher and compares small data with data of small science
3、. On this basis, it expounds the relationship of small data of research and micro-knowledge services. Furthermore, it detailed analyzes the key pattern and typical characteristics of micro-knowledge services based on small data 2of researcher. Finally, it discusses some problems which are paid for a
4、ttention and solved. Keywords small data; researcher; micro-knowledge; knowledge service; scientific research 当前,随着“互联网+”相关技术的发展和以密集型科学数据驱动为主要特征的科学研究模式日趋扩大化和深入化,促使支撑科研过程的知识服务变得愈加趋于精细化和快捷化。仅仅依靠科研用户主动描述自身需求,并单独由学科馆员进行知识组织和服务,在很大程度上,导致所推送的服务产品过于粗粒度化,而且服务周期长,因此,这一服务模式已经很难满足新型科研范式下用户的知识服务期望。因此,如何精准获取科研用户
5、实时需求,以前瞻性视角快速进行专业化知识服务的推送,是关系到图书情报机构服务创新和转型的重要突破口。不难发现,小数据作为科研用户的个体化数据,既是科研用户在研究过程中的虚拟化数据描述1,又是其个体独特性需求的表征,为科研用户的需求挖掘和预测提供了基础,通过组建一支跨时空、跨组织的专业知识服务团队,针对科研用户具体化和细微化研究问题,发挥微知识的精炼化、通俗化优势,以知识协同的视角来重组个性化知识推送服务流程,对于提高服务效果是具有重要意义的。 1 面向科研用户的小数据概念 1.1 科研用户小数据的内涵 美国康奈尔大学的 Estrin 教授认为用户的小数据是其日常行为活动的全部表征,从医学的视角
6、来看,用户的日常行为可以作为病理诊断的3一种医学证据,因此,医护人员可以通过对用户每时每刻的行为数据进行收集、监测和跟踪,以分析出用户在不同时间段的个人健康状况2。就理解而言,小数据是个人信息的虚拟化表示,是通过各种方式(如移动终端、可穿戴式产品、网络行为监测、视频监控等)对涉及个体数据的全方位收集,通过对这些不断累积的数据进行整合,从而为个性化服务决策提供依据。基于此,科研用户小数据就是个体研究工作者在项目推进过程中全部行为和状态的数字记录集合。从数据本质角度来看,面向科研用户的小数据主要涵盖了个体的基本信息、行为记录、习惯偏好、情绪变化、性格特点、研究问题等,通过对这些数据进行追踪、收集、
7、分析和应用,可以实现科研用户立体化和全方位的数据描述。 尽管科研用户小数据仅仅只是针对个体所涉及的数据集合,但是随着时间的推移及其项目研究过程的推进,科研用户所产生的小数据量会变得越来越大,这为支持科研用户的需求决策提供了数据基础。如,浙江省图书馆根据读者借阅的各项原始小数据,并结合时下流行的星座元素,准确呈现了每个星座读者群体的阅读偏好和借阅习惯,据此为不同人群进行了定制化的阅读推荐3。 1.2 科研用户小数据与小科学数据的关系 相对大科学而言,小科学通常是指个体科研用户或科学小组开展以研究为主要特征的小规模科学活动4,其研究过程主要包括科研用户自行设定问题、独立执行和探索式解决5。因此,小
8、科学项目主要解决特定的科学问题,以假设驱动,并且多集中于单一学科,科研资源和人员相对投入较少。在小科学项目的研究活动中所产生的全部科学数据被称4为小科学数据,其中主要包括实验数据、仿真数据、结果数据等。然而,科研用户小数据是围绕个体研究人员而言的,是科研用户在进行研究活动时,全面描述科研用户的数据。由此可见,小科学数据是围绕整个小科学项目,并针对科研问题提出、分析和解决,所产出的科学数据集合,而科研用户小数据是涉及个体科研用户的全部行为或活动数据,更加注重以科研用户为唯一对象的个体性特征数据。在一定程度上,小科学数据是对科学问题的描述,能够从侧面体现出科研用户的需求,此时这部分小科学数据又可以
9、作为科研用户小数据集合的一部分,解释科研用户的行为模式或者情景变化过程。例如,当科研用户在攻克项目难题时,针对其中某个具体问题的分析和总结所做的文本记录数据,既属于科研用户小数据,又属于小科学数据。因此,科研用户小数据与小科学数据既相互区别,又具有一定联系,小科学数据可以为科研用户小数据的采集、分析、处理、应用和决策过程提供支持,提升小数据的价值总量和可用性。 2 科研用户小数据与微知识服务的契合性 学科的交融与发展,推动着以科学数据为驱动的知识发现和知识创新的科学研究模式产生,这也进一步促使了科研用户行为和需求的转变。如今,科学数据已经成为科研用户的重要研究对象。2008 年,Heidorn
10、首次提出了科学数据的长尾理论,并认为,如果将所有的科研项目按照其规模,以从大至小的方式沿着一条轴线进行排列,可以发现,那些较小的科研项目构成了整体科研的长尾6。在这一科研长尾上,科研用户所产生的科学数据通常是趋向于异质并未被系统整合和管理,其行为模式更具有不确定性7,这样导致科研用户需求也是经常被忽略。然而,5与科研长尾上的科研用户不同,对于开展大规模复杂研究项目的科研用户而言,在长期的研究过程中,这类用户所产生的科研需求更加趋于密集型的知识服务内容,以及正式化的沟通反馈方式,因此,这些科研用户的行为模式通常也具有一定规律性,并已经形成了自身固定的分析问题和解决问题的习惯方式。此外,对于科研长
11、尾以外的科研用户,其知识服务的需求更加重视系统化和深入化。由于受图书情报服务机构本身预算和能力的限制,加上处于科研长尾上用户的需求层次不一,同时具有很大的不确定性,可能部分需求是零散的,这样导致图书情报服务机构恰好被忽视了这一部分科研用户的需求,而主要将知识服务重点围绕在大型项目的科研用户上。因此,科研用户小数据是其全方位状态的具体表征,能够高效地分析和获取科研用户的需求,为个性化和专业化的服务奠定基础。 微知识服务充分发挥了微知识和微服务的优势,一方面,微知识是针对科研用户在研究过程中所遇到具体问题的答案,具有碎片化、精炼化的特点,与此同时,微知识是将大块单知识进行分解、萃取,再以问题的形式
12、对其进行深度标引的结果,是经过提纯加工的浓缩知识8,强调了知识的特质化与细致化;另一方面,微服务是以用户需求为导向,支持用户解决具体问题,利用当前快捷的社会化媒体工具(如微博、微信、微视频、微课堂等) ,进而实时动态为特定用户推送个性化服务。由此可见,对于科研用户小数据的充分挖掘,有利于高效分析科研用户的实时需求,甚至以前瞻性的视角预测需求的变化趋势,而微知识服务团队可以通过全面融合不同层次的微知识库,发挥自身知识整合处理能力6优势,在分析科研用户领域知识库的基础上,实时为科研用户提供知识服务,并根据其反馈结果,对微知识库进行动态化更新。总之,微知识服务重视科研用户的细分,并强调了将各类科研用
13、户看成服务工作的主体,面向科研用户的小数据与微知识服务的结合,对于图书情报机构个性化服务的提升具有重要理论意义和实践意义。 3 面向科研用户小数据的微知识服务模式 面向科研用户小数据的微知识服务重点强化了以单个科研用户的个性化服务为原则,强调科研用户小数据的全面收集和处理,通过对科研用户整个研究过程的行为状态、角色状态进行数据描述,以此获取科研用户当前知识需求,在服务团队与科研用户知识协同的基础上,以一种全局性的视角对科研用户的需求变化趋势进行预测,并结合微知识库,对知识推送服务产品进行优化,从而多渠道、全方位、多层次满足科研用户动态化、碎片化需求(见图 1) 。 (1)面向科研用户的小数据收
14、集是开展微知识服务的关键环节。不同的科研用户在研究过程中,由于其专业背景、认知能力和研究任务的不同,所导致的行为方式、需求层次、心理反应也是不同的9,因此,描述科研用户的小数据集合也是形式多样、内容各异。如袁静等10认为与用户相关的信息主要包括用户基本信息、用户行为情景信息、用户社会关系信息。William11将用户的个人信息类型划分为纸质文档、网页、电子文档、邮件以及引文、链接等。李爱国等12以学习者信息模型为基础,将用户信息按照内容分为用户基本信息、用户需求信息、用户行为信息和用户反馈信息。综上所述,笔者通过对科研用户的研究过7程进行梳理,按照描述科研用户的小数据属性,将其分为两类,即具有
15、物理属性的科研用户小数据和具有虚拟属性的科研用户小数据(见表 1) 。一方面,微知识服务团队根据科研用户的研究任务和问题,以时间维度或空间维度作为参考,对科研用户小数据的内容进行分类,确定针对科研用户不同视角的数据描述;另一方面,在科研用户小数据的同一类别中,将具有物理属性和虚拟属性的小数据集合进行全面关联和聚类,从而形成具有一定逻辑结构的小数据集合。 (2)在初步建立的小数据资源库的基础上,以科研用户需求为导向,对其进行分析处理,从而建立相应的小数据知识库。其具体过程主要包括:小数据整合。主要是结合科研用户研究的时序,将不同载体和形态的小数据进行整理、滤重、转换等一系列交互活动,建立小数据的
16、规范化表示形式;小数据挖掘。主要是通过对小数据进行特征分析和提取,围绕科研用户的各类具体问题解决过程,利用时序分析方式进行小数据集合的内在关联挖掘,使之内化为具有高度内聚的集合体;小数据契合。主要是指通过结合科研用户实时情景和对应的数据媒介,将关联后的数据与当前科研用户情景进行融合,据此生成围绕科研用户不同类型和层次需求的数据链,这些不同的数据链可以从多样化视角来描述科研用户的需求状态。由于科研用户的同一需求事实或需求规律可以隐藏在不同数据链中,不同的数据链也可以揭示同一需求事实或需求规律的不同侧重点,因此,这为判断科研用户的需求强度提供了契机,也为服务团队有意识地融合多样化数据链提供了保障;
17、小数据监护。主要是指小数据的维护和管理,一方面,由于科研用户的小数据集合是随着8时间而不断累积的,进而需要对数据进行实时的更新和管理;另一方面,科研用户在研究过程中,可能会因为突发事件,导致其在某一层面上科研任务的中断,此时服务团队需要对小数据链进行偏差的纠正以及缺失数据的处理,以此保证各个小数据链的完整和统一。 (3)基于小数据知识库的科研用户需求获取和微知识服务推送。小数据知识库作为一种特定形式的数据知识库13,是科研用户特征知识空间的集合,可以充分展现科研用户在时间维度和空间维度的需求视图。服务团队可以结合科研用户的实时情景状态,对小数据知识库进行交互的同时,对需求特征知识进行再挖掘和再
18、利用,这样能够深入地感知科研用户的知识需求,及时的预测用户需求的变化趋势,从而利用自身的专业技能和学科优势,有针对性的提供个性化微知识服务。与此同时,根据科研用户的研究需要以及相同或相似层次其他相关研究项目或人员的研究现状,通过与科研用户进行协同,构建特色化的微知识库。其中微知识库是以专业领域知识库为基础,并结合不同层次的科研用户在不同类型的研究过程中的学科化知识,通过对这些复杂知识进行分解、提取和重新组织,进而呈现的一些碎片化科学问题解决方案知识库。此外,在微知识服务推送过程中,一方面,由于微知识已经具有独立功能的“模块” ,服务团队可以充分利用这些“模块”根据需求将其进行有机的组织或串接,
19、以完成特定功能的高度内聚化的知识形式,在对微知识库进行不断更新、完善和管理的同时,并协同专家知识和能力,可以在短时间内以最灵活的服务方式为科研用户提供相应的专业化知识服务,以此充分利用科研用户的碎片化时间,提升科研用户的体验度。 4 9面向科研用户小数据的微知识服务典型特征 4.1 全方位的用户需求呈现 科研用户在不同的研究阶段,其知识需求的产生、发展是一个渐变的过程,尽管这些需求可以通过科研用户的情景状态、行为模式以及科研任务而以不同的角度呈现出来。但是,在不同的时刻,这种表现力强度也是不尽相同,在不同程度上,会体现出相关关系、因果关系,甚至会产生矛盾,而且在短期内,科研用户的需求可能表现出
20、零散性和不确定性,因此服务团队难以系统掌握科研用户需求,而且即使服务团队感知到了此类需求,也会花费大量时间,这样缩短了服务内容的选择和服务产品的优化时间,导致服务满意度偏低。鉴于此,面向科研用户的小数据作为其全方位的数字描述,通过对小数据的整合、分析和处理,无论是从时间维度,还是空间维度上,服务团队都能够在短时间内准确获取科研用户的需求及其相关变化情况,尤其是在研究过程中的学科知识需求,并据此不断优化微知识库,为科研用户微服务提供基础。 此外,科研用户的研究活动虽然在总体需求趋势上,会体现出一定的规律性和可预测性,但是随着科研用户项目进展的深入,以及自身专业背景和认识能力的影响,在特定环境下,
21、对于一些涉及跨学科或跨领域的细致化专业问题的微知识需求,会呈现出随机性和复杂性。但是通过科研用户小数据的融合,对某些不确定的需求,可以借助服务团队与科研用户的协同沟通反馈,以对小数据进行系统化梳理和层次化整合,排除具有干扰性的影响因素,从而促进科研用户需求全方位、多层次的挖掘和呈现。 104.2 个性化的专业服务推送 在整个服务流程中,从科研用户小数据的收集、分析以及需求获取都是围绕个体科研用户而展开的;在服务方式方面,微知识服务是以微知识库为基础,以科研用户的专业知识需求为出发点,以协同互动为手段而进行的专业化服务;从服务内容来看,微知识库是以科研用户及其研究任务为导向而构建的动态知识库,是
22、把传统的庞杂学科知识进行再分解、深萃取,并根据科研用户的专业项目问题,对微知识进行系统组织、深度标引,最后结合科研用户研究情景,经过服务团队的综合评估,最终推送于用户的精炼化知识产品;从服务主体来看,整个服务团队具有跨学科的专业背景,包括学科馆员、数据馆员、信息专家等,这些服务人员能够以知识协同的方式,对服务于科研用户的微知识进行吸收、扩展、组织和管理,大大优化了服务流程,保证了专业化的微知识服务质量;从服务方式来看,服务团队根据科研用户的细微化和个体化特征,结合科研用户的兴趣偏好,利用社交媒体、移动网络等微服务工具,采用综合化信息手段,进行适合于科研用户的差异化服务推送。因此,微知识服务充分发挥了服务团队的协同能力,通过运用相关的微服务技术手段,对庞杂的文献资源、网络资源等进行系统化的分析和组织,针对研究环境的转变,注重科研用户的体验,从而为其快速准确地推送即时化、碎片化的微知识产品。 4.3 实时化的动态反馈跟踪 在面对数据密集型科研范式的环境下,微知识服务是为特定科研用户提供的细微化、个体化和差异化的数据或知识服务,其充分借助了移