1、1国外数据监护教育与职业发展研究摘要:从理论研究与实践进展两方面分析国外数据监护教育与职业发展。归纳国外数据监护教育与职业发展的 5 个特点:教育与培训课程正在兴起,课程类型多样,形成了针对各层级的教育与培训项目,存在多种形式的合作模式,课程内容体现实际岗位技能需求。最后总结对我国数据监护教育与职业发展的启示。 关键词:数据监护教育 数据管理课程 培训项目 职业技能 科学研究,无论是自然科学,还是人文社会科学,通常需要利用并产生大量的科学数据。从 2002 年我国启动科学数据共享工程开始,国内学者及机构就已开始了对科学数据的研究。进入 21 世纪,随着 e-Science 的产生,科学数据的作
2、用和地位被提到了前所未有的高度,以科学数据的长期保存、组织、维护、管理和再利用为重点任务的 Data Curation(美国经常使用该称谓,在英国通常使用 Digital Curation)作为一个新兴的研究领域应运而生。对于这一新术语,国内还未有一个统一的翻译。笔者较为倾向杨鹤林在数据监护:美国高校图书馆的新探索一文中所提出的译名。下文将以“数据监护”作为对此新术语的中文译名。 国内图书情报学领域较早涉及数据监护的是杨鹤林。随后,谭榕、程莲娟、吴敏琦、沈婷婷等对数据监护的定义、产生背景、意义、图书馆的实践活动等进行了研究。钱鹏和郑建明、师荣华和刘细文则从科学2数据组织与服务的角度开展研究,对
3、科学数据的含义、组织与服务模型、实施路线、需解决的关键问题、生命周期流程下的图书馆数据服务进行了相关研究。总体来看,国内目前对数据监护的研究还不多,主要是对国外发展情况进行概括性介绍,对数据监护发展中一个重要的问题教育与职业发展,仅简要提及,还未有专门文献研究该主题。本文将详细介绍国外(主要是英国和美国)数据监护教育与职业发展的理论与实践进展,为国内图书情报学教育课程体系的构建及人才培养提供借鉴。 1 国外理论研究 大规模数据集的收集、组织与存储催生了对具有数据监护技能的数据人文主义者(Data Humanist) 、数据专家(Data Scientist) 、数据研究科学家(Data Res
4、earch Scientist) 、数据服务馆员(Data Services Librarian)等岗位的需求。岗位的需求促使国外不少学者研究数据监护的职业技能,并根据不同的角色提出了不同层次的技能需求。研究内容主要有 3 类: 一类是从整体上分析数据监护相关利益者的角色与职责。2007 年,L,Lyon8总结了数据监护各相关利益群体,包括科学家、数据管理机构、数据中心、第三方数据使用者、基金资助者、出版商,并分析各自的角色、权利、职责及相互间的关系。2008 年,A.Swan 和 S.Brown 在英国 JISC 报告中提出了科学数据服务的 4 种角色:数据创造者(Data Creator)
5、 、数据专家(Data Scientist) 、数据主管(Data Manager) 、数据馆员(Data Librarian) ,并区分了各自的职责与技能,部分技能呈现相互交叉(见图 1) 。 3第二类是专门研究图书馆员在数据监护中的角色定位及职业技能。一部分学者通过问卷调查与访谈形式了解馆员对数据监护工作技能的需求。如:A.Creamer 等通过对美国新英格兰地区 6 个州的 141 个健康科学馆员及科学技术馆员的调查,了解他们在数据监护实际工作中所需的技能。调查结果列出了 20 个数据监护相关的技能,馆员们经常使用的技能有 Web2.0 技术、数据存档与保存服务、数据管理工具的使用、数据
6、共享与机构库管理、宣传推广、了解研究人员的数据管理需求等。同时也指出,目前开展数据监护的图书馆还不多,但图书馆已开始意识到自身在数据监护中的角色及掌握数据管理技能的紧迫性,已开始对数据管理进行战略规划。Y.kim 等通过访谈了解 eScience 专家及实习学生的工作任务与工作技能以总结 eScience 专家应具备的职业技能。他们将所需的技能分为三大类:数据相关的技能(包括原始数据收集、二次数据收集、数据存储、数据管理、数据分析及数据展示等 6 大技能) 、与人相关的技能(包括发现合作机遇、与人交流、团队与组织合作、分析科研人员需求、促进科研人员与信息专家的合作、教育与培训等技能)及与事物相
7、关的技能(主要是计算机与软件的使用技能,包括调研及推荐技术解决方案、辅助科研人员使用 IT 技术等) ,并推荐了 10 个课程供 eScience专家参考,包括数据监护、数据库设计与管理、项目管理、数据挖掘等课程。 第三类是追溯数据管理技能的教育与培训机构以了解他们对数据管理人才的培养计划。2012 年,V.E.Varvel Jr 等对 55 家 iSchool(图书情报学或信息学院)在 2011 年秋季学期开设的 476 门数据相关课程进行4了调研,发现仅有 11 所机构提供专门针对数据监护的课程,12 所机构提供了数据相关的课程,15 所机构提供涵盖数字内容但是未涉及数据监护的课程。A.T
8、.Creamer 等对北美 58 个 ALA 认证的图书情报学项目(来自美国、加拿大及波多黎各)进行了调查,通过搜索各机构主页上 2011 年秋季至 2012 年春季及夏季的课程目录、课程大纲及课程描述,统计涉及科学数据生命周期管理但不包含元数据、数据挖掘及结构、数字馆藏、数据库原理、数据可视化与分析、数字图书馆、数据网络与信息系统等相关的课程。调查发现,仅 22%(共 13 个)的课程专门涉及数据监护。Spencer D.C.Keralis 在 2012 年 8 月图书馆与信息资源委员会(Council on Library and Information Resources,CLIR)发布
9、的报告 The Problem of Data 中撰写了数据监护教育部分的内容,归纳了图情领域目前的数据监护教育课程及大学之外的其他机构组织的培训项目。总体而言,国外理论界已开始对数据监护的职业技能进行探讨,对各利益相关者的角色与技能都提出了不同的要求,还调研数据监护教育课程与培训项目的现状,为国外图书馆、研究机构等根据自身角色参与数据监护教育与职业技能的培养提供了理论指导。 2 国外实践进展 2.1 数据监护教育与职业发展项目 近年来,国外不少项目开始研究数据监护各利益相关者应具备的职业技能。在英国,联合信息系统委员会(JISC) 、数字保存中心(Digital Curation Centr
10、e,DCC) 、研究信息网络(Research Information Network,RIN) 、数据档案馆(UK Data Archive,UKDA)等组织成为探索数据监护职业技能的领先者。JISC 的 RDMTrain 项目(项5目时间:2010.8.1-2011.7.31)资助了艺术学科、考古与社会人类学、健康研究、心理学、地理科学、社会科学与临床心理学等学科领域的数据管理培训。此外,JISC 与 RIN 合作资助由 DCC 领导的 DaMSSI 项目(项目时间:2010.11-2011.8) ,旨在促进由 Vitae 开发的“研究者开发框架”及英国高校与国家图书馆学会推出的信息素养
11、7 个支柱模型等工具的应用,帮助研究者更有效地组织数据管理培训与职业发展。目前,DaMSSI已进入第二阶段(Assessment,Bench marking and Classification,简称 DaMSSI-ABC,2012.8-2013.8) ,将继续第一阶段的工作,并支持JISC RDMTrain 项目所开发的科研数据管理培训资源的发布与重用。另外,由欧盟委员会资助,来自欧洲、美国、加拿大的多家机构参与的 DigCurV项目(项目时间:2011.1-2013.7)旨在建立一个数据管理职业培训的课程框架,为图书馆、档案馆、博物馆及文化遗产机构的从业者提供必要的新技能以促进数字资源的长
12、期保存与管理。 在美国,北卡罗来纳大学教堂山分校图书情报学院为全美数据监护教育与培训做出了突出贡献。2008 年,该学院建立在线论坛(Digital Curation Exchange)促进数据监护教育领域资源的共享。2009 年 10 月,受 JISC 及美国博物馆和图书馆服务协会(Institute of Museum and Library Services,IMLS)的资助,该学院与 DCC 合作开展项目“缩小数据监护的差距:促进数据监护实践、研究及教育的国际合作” ,旨在为中小文化遗产机构提供基本的数据监护知识与技能,为相关利益组织提供教学内容与角色定位的框架模型,并提供相关的教育工
13、具。项目原计划是 2009.10-2011.9,后来延长至 2012 年 10 月。此外,美国国家科学6院的研究数据与信息董事会(Board on Research Data and Informarion,BRDI)在 2011 年 12 月启动了一项对数据监护职业发展机遇与教育需求的研究。该项目旨在确定数据监护职业发展的技能,为数据监护从业者探寻可行的职业发展道路,调研及评估现有的数据监护教育与培训模式,最终形成一个建议报告。 2.2 数据监护教育与职业发展的会议 国际研讨会往往是一个新兴的学科领域或者研究领域得以确立的标志,也是促进相关领域的研究和实践进展的不可或缺的组成部分。2008年
14、,DCC 与 RIN 联合举办的第二届“研究数据管理论坛”探讨数据管理的角色与职责。2011 年 6 月 29 日,DCC 举办“国际数据监护教育论坛”研讨会,为数据监护领域的教育人员、培训人员、学生及从业者提供课程设计、教材的编制、学术资料与教程的使用等方面的交流与探讨。2008年,DCC、欧洲数据保存联盟与北卡罗来纳大学教堂山分校图书情报学院联合推出 IDEA 项目,目的是促进数字保存教育与培训的国际合作与交流,至 2011 年,已举行 7 次会议。北卡罗来纳大学教堂山分校图书情报学院开展的 DigCCurr 第一阶段项目(2007-2009)分别在 2007 年和 2009 年举办了两次
15、关于数据监护教育与培训的会议。2007 年会议主要侧重于对数据监护的认知及所需具备的职业技能。2009 年会议主要探讨数据监护的具体实践及未来展望。DigCCurr 第二阶段项目(2008-2012)举办了一系列公共研讨会及博士生研讨会以分享数据监护的最新进展,目前已召开 3 届公共研讨会。美国国家科学院的 BRDI 于 2012 年 7 月 19 日至 20日召开了主题为“大数据时代的数据监护:职业发展机遇与教育需求”7的研讨会,来自政府、大学及私人企业的从业人员从各自角度分析对数据监护的看法,并探讨数据监护的教育与职业发展。 2.3 数据监护教育与职业发展课程 教育、培训和课程体系的建立是
16、一个领域得以持续发展的重要保证。目前,国外数据监护的教育已经基本形成了从本科生到硕士、博士,以及在职进修的课程体系。笔者以国外研究数据监护教育与职业发展的文献为线索,参考 DCC 网站的“Data Management Courses and Training栏目列表,并访问和检索各大学及机构的网站,从开设机构、课程名称、开课时间、授课对象、课程模式、课程内容等方面调查国外目前数据监护教育与培训课程的现状。并依据开设机构的不同,将国外数据监护教育与培训课程划分为两类:一类是大学图书情报学院开设的专门课程(见表 1) ,该类课程具有教育性质,授课形式正规,一般授予相应的学位,门槛较高,通常仅针对
17、图书情报学领域硕士及博士,学生不仅需要学习数据监护相关的课程,有时还需要学习数字图书馆、数字保存、信息管理等课程。另一类是非大学图书情报学院组织的培训课程(见表 2) ,该类课程具有培训性质,一般不授予学位,形式比较灵活,一般采取研讨会、座谈、短期培训等方式,门槛较低,相关从业者或感兴趣者都可参加。由于是培训性质,培训内容较有针对性,一般集中在数据监护的内容。由于篇幅限制,本文未列出所有的课程,仅选择了一些开展较成熟且反响较好的课程列在表 1 和表 2 中,为国内图书馆、图书情报学院等机构开展数据监护教育与培训提供参考。 3 国外数据监护教育与职业发展的特点与启示 8(1)数据监护教育与培训的
18、课程还不多,正在兴起 通过调查,笔者发现国外很多数据监护课程与培训计划都是近两年开始设置的,如雪城大学信息学院 2012 年开设的数据管理相关课程及美国国会图书馆2011 年开展的 DPOE 培训计划。从 V.E.Varvel Jr、A.T.Creamer、Spencer D.C.Keralis 等作者及笔者的调研来看,目前国外数据监护教育与培训处于尝试与探索阶段,体现在专门针对数据监护的课程还不多,有的课程名称虽然是数据监护,但课程内容仍是传统的数字保存与数字图书馆,还有的是根据现有课程的简单修改而开设的。但不管怎样,国外图书情报学院及图书馆已经敏锐意识到数字科研环境下数据组织与管理、数据保
19、存与利用的新需求,主动变革课程体系以培养数据管理的人才,并开展各种形式的培训更新与提高馆员的数据管理技能。 目前国内的图书情报学院有的课程已不能适应实际工作需要,应抓住数字科研的契机,并吸取国外的经验,设置数据监护课程。在课程设置上尽量将数据监护课程与原有的数字图书馆课程区分开来,在原有数字图书馆课程的基础上,多增加科研工作流、科研生命周期、科研数据分析、学科背景知识等内容的教学。此外,考虑到科学数据管理涉及学科背景知识,图书情报学院在招生时可考虑增加具有自然科学、计算机技术、工程学及数学等学科背景的学生,以更好地适应未来科学数据管理的工作需求。对图书馆来说,应开展多种形式的培训,更新馆员的知
20、识技能以适应未来数据驱动的科研,特别是帮助学科馆员重新审视自身的职业发展规划,推动学科馆员承担数据馆员及数据科学家的角色与职9责。可喜的是,国内图书情报学领域开始逐步认识到科学数据管理的重要性。2012 年 11 月 4 日北京大学图书馆 110 周年会议“变革与走向:重新定义大学图书馆的未来”将“数据管理与数据服务”作为主题之一。图书情报工作杂志社发起的“新型图书馆员能力培训班”(2012.11.1418)也将科学数据作为其中的一项培训内容。2012 年数字图书馆前沿问题高级研讨班将“科学数据管理与学科服务”作为分会场主题之一。 (2)课程类型多样,还未形成统一的课程模型 由于数据监护还处于
21、发展阶段,国外不同学者及不同机构根据自己的理解及需求提出了不同的技能要求,导致课程体系也呈现多样化趋势(如:课程名称及课程内容的多样化) ,迫切需要统一的课程模型与体系以指导各类机构开展数据监护教育与培训。为此,2009 年北卡罗来纳州大学教堂山分校图书与信息学院的 C.Lee 提出 DigCCurr Matrix,该矩阵设计了数据监护课程体系的 6 个维度,任何一门课程可选择其中的一个维度或几个维度进行内容设计(见表 3) 。另外,马塞诸塞大学医学院的Lamar Soutter 图书馆与伍斯特理工学院的乔治戈登图书馆联合发布了数据管理课程框架。该项目受美国 IMLS 及美国国家医学图书馆资助
22、,为自然科学、健康科学及工程领域大学生及研究生的数据管理教育提供课程规划。该项目认为数据管理课程一般包括 7 个模块:科研数据管理概况;数据类型、阶段与格式;元数据;数据存储、备份与安全;法律与道德问题;数据共享与重用政策;存档与保存。该框架为准备或正在开展数据管理课程的机构提供了一个模型,在课程设置时可根据学生实际10需求选择其中几个部分或全部。因此,我国的图书情报学院及图书馆在开展数据监护教育与培训时,可参考国外这些成型的课程框架。不过需要说明的是,即使是有统一的模型框架,也只能作为参考,国内相关机构需要根据自身需求设计具体教学与培训内容。 (3)形成了针对各层级的教育与培训项目 国外形成
23、了针对不同人群的数据监护教育与培训体系,不同层次群体可根据各自需求选择参加教育和培训,获取所需的职业技能。如:在校学生可选择相应的本科生、研究生或博士生的培养课程。在职的数据/信息专业人员、研究人员可参加图书馆或其他机构组织的继续教育项目,或选择各图书情报与信息学院提供的教育课程。我国的图书情报从业群体与国外基本类似,也需要针对不同层次水平开设不同的课程与培训体系。 (4)存在多种形式的合作模式 国外的图书馆及大学图书情报学院成为数据监护教育与职业发展的主力。这主要是因为数据监护作为一项知识服务,其数据处理和管理方法实际上源于信息管理,正是图书馆及图书情报学院的强项。为培养数据监护相关人才,国外图书馆及大学图书情报学院开展了不同形式的合作,包括图书馆之间合作(如 CLIR/DLF 的 Data Curation Fellowship Program) 、图书馆与图书情报学院合作(如:纽约布拉特学院图书情报学院与布鲁克林公共图书馆、布鲁克林博物馆及布鲁克林历史协会合作开设的课程) 、图书情报学院与学校其他部门合作(如:亚利桑那大学图书情报学院与外事学院合作开设 DigIn 课程、缅因州大学数据监护课程