1、1嵌入科研工作流与数据生命周期的数据素养能力研究摘 要:文章首先分析归纳了科研工作流与数据生命周期的一般流程,接着调研数据素养核心能力研究现状,剖析国内外学者提出的几种较有代表性的数据素养核心能力体系,最后梳理了嵌入科研工作流和数据生命周期的数据素养核心内容体系,绘制了研究人员应具备的数据素养能力框架。 关键词:数据素养;科研工作流;科研数据生命周期 中图分类号: G254.97 文献标识码: A DOI:10.11968/tsyqb.1003-6938.2016085 Core Competencies of Data Literacy Embedded in Research Workfl
2、ow and Data Lifecycle Abstract The research work flow processes and general research data lifecycle are summarized at first, and then research status of data literacy core competencies is investigated and several representative core competencies frameworks are analyzed, and finally core competencies
3、 framework of data literacy around research work flow processes and research data lifecycle are built. Key words data literacy; research workflow; research data lifecycle 21 引言 大数据时代的到来正在改变 21 世纪公民的素养格局,尤其是数据密集型第四科研范式下,具备良好的数据素养和熟练的数据技能已成为研究群体开展研究工作的重要能力保障1。然而,实践工作中庞大的数据量和复杂的数据管理问题使得研究人员面临严峻挑战,为适应数据
4、驱动的新型研究环境,应对科研实践中的各种数据问题,培养研究人员的数据素养能力势在必行。那么数据素养是什么?M.Schield2认为数据素养是根据科研需求在不同数据源中获取、操作和总结数据,并从中推断结论的一种能力;J.Qin 和 D.Ignazio3认为数据素养是“研究者在科研过程中收集、处理、操作、评估和利用数据的能力” ;P.Calzada 和 M .粤忆.Marzal4认为数据素养“包含个人获取、理解、批判性地评估和管理数据的能力,并在使用数据的过程中遵守道德规范” 。总体而言,数据素养强调的是一种正当地发现和获取数据、批判地选择和评估数据、规范地管理和处理数据、合理地利用和共享数据的意
5、识和能力。 目前,国内外学者已就数据素养能力体系展开探索,并积累了一定的成果和经验,主要集中在三个方面:一是从数据素养的概念和内涵出发,梳理数据素养包含的各种能力,如 J.Qin3、郝媛玲和沈婷婷5等;二是图书馆员在长期从事科研数据管理服务的基础上,概括和总结数据管理过程中所需的技能,如 Carlson.J6、A.L.Ogier7等;三是从数据素养的上位类概念信息素养出发,在信息素养能力标准中提取数据相关的能力,如 C. P.Javier 和 M.粤忆. Marzal4等。然而,从研究项目启动之初的数据产生、项目实施中的数据处理和分析到项目结题时基3于数据得出研究结论、发表科研成果,再到后续研
6、究中对数据的二次开发和利用,科研数据已成为科学研究工作的基本单元渗透到科研工作流的各个环节,数据素养与科研工作流、科研数据生命周期密不可分。因此,构建嵌入科研工作流、围绕科研数据生命周期的数据素养能力框架,对于更好地培养研究人员的数据意识和数据管理技能具有重要意义。基于此,本文从科研工作流和数据生命周期的一般流程出发,调研了数据素养核心能力研究现状,整理并分析了国内外学者提出的几种典型的数据素养核心能力体系,梳理并归纳了嵌入科研工作流和数据生命周期的数据素养核心内容体系,绘制研究人员应具备的数据素养技能流程图,以期为衡量研究人员的数据素养能力和探索数据素养教育实践提供参考和建议。 2 科研工作
7、流与数据生命周期 数据从收集(或形成) 、加工、保存、传播、检索、存取与利用,到消失或不再被利用的过程,就是数据的生命周期8。随着科技的发展和时代的快速进步,有些数据永久地休眠,再也得不到利用;而很大一部分数据却只是进入了暂时的休眠状态,它们将来可能会根据人类的需要再次被激活和更新,进入下一个“生命周期” ,周而复始,生生不息。在数字科研环境下, “生命周期”不同于产生到消亡的“生命期” ,它是一个循环过程,经过数字资源管理和长期保存,实现数字资源发现和再利用9。在科研实践过程中,处于生命周期不同阶段的数据具有显著差异,不论是数据的类型格式还是内容含义,亦或数据的量级特性,均不可一概而论。正确
8、认识科研数据生命周期,把握生命周期各个阶段的数据特4性,培养良好的数据素养能力,是实现科研数据规范管理和发挥数据价值最大化的前提和基础。 目前,科研工作流与数据生命周期已得到业界的广泛重视,英国联合信息系统委员会(JISC) 、美国地质调查局(USGS)等国家组织委员会,英国数据管理中心(DCC) 、英国数据档案(UKDA) 、地球数据观察网络(DataONE)等数据管理专业机构以及弗吉尼亚大学、阿尔伯塔大学、昆士兰大学等学术研究机构纷纷就科研数据生命周期展开探索研究,建立科研工作流与数据生命周期模型,以规范和指导数据管理工作的正常开展。 为深入了解科研实践的具体流程,笔者选取了国际上较典型的
9、科研数据生命周期进行剖析,以总结和梳理科研工作流和数据生命周期的一般流程。8 种模型具体为:英国高等教育、继续教育和技能培训提供研究支撑的英国联合信息系统委员会(JISC)10;英国专门负责大型社会和经济数据的采集、监管并提供数据访问与获取的专业机构英国数据档案(UKDA)11;世界领先的数字信息管理中心英国数字内容管理中心(DCC)12;世界上最大的社会科学数据中心美国校际社会科学数据共享联盟(ICPSR)13;地球环境科学领域的数据管理专业组织地球数据观察网络(DataONE)14;专注于统计数据和社会科学数据描述的国际标准协会数据文档倡议联盟(DDI)15;美国弗吉尼亚大学图书馆16;加
10、拿大阿尔伯塔大学图书馆17(见表 1) 。 笔者在分析梳理国外典型科研工作流与数据生命周期模型的基础上,结合国内研究实践,绘制了嵌入科研工作流的科研数据生命周期一般流程(见图 1) 。除了项目5启动、项目实施和项目结项三个核心阶段外,还包括项目启动前的研究构想以及项目结束后的后续研究。科研数据生命周期的一般流程包括八个阶段,分别是数据管理计划、数据产生与收集、数据管理与组织、数据处理与分析、数据存储、数据发表与共享、数据发现与获取、数据再利用,各个阶段环环相扣,紧密相连。下文将以此为基础梳理和构建围绕科研工作流和数据生命周期的数据素养能力框架。 3 数据素养核心能力研究现状 能力标准为图书馆服
11、务开展和各级各类教学提供了明确的目标和方向,也为各个机构的课程设计提供了基本的框架和指南18。数据素养是信息素养的子集,目前,信息素养领域已建立了较完善的能力标准体系,既有以美国、英国、澳大利亚、加拿大等区域性信息素养能力标准,又有面向中小学教育、高等教育的层级性信息素养能力标准,以及大众传播学、人类与社会科学、护理学、科学与工程技术等以学科划分的领域信息素养能力标准。尽管这些标准对于数据素养评估和教学有一定的参考意义,但就数据素养应用实践而言,仍亟需数据素养能力标准或框架来衡量研究人员的数据素养能力和指导数据素养教育工作的开展。 目前,这一问题已获得国内外学者的广泛关注,他们从不同的角度,结
12、合数据管理服务和数据素养教育探索的实践经验,构建数据素养能力体系,推动数据管理培训和数据素养教育的发展。如美国雪城大学 J.Qin等3对比了信息素养、数字素养和科学数据素养的不同概念,指出科学数据素养包含数据收集、数据处理、数据管理、数据评估和数据利用五个方面的技巧和能力。并以此为基础,为学校 STEM 各专业本科生开设科6学数据素养课程;美国弗吉尼亚理工大学图书馆为满足学校师生的数据管理需求,A.L.Ogier 等7图书馆员开发了数据素养课程,其教育内容模型包括八个方面:数据管理与组织、数据转换与互操作性、数据共享与获取、元数据与质量控制、数据科学、数据监管、数据存档与保存、数据伦理与责任;
13、美国印第安纳大学图书馆 S.Konkiel 等19设计了包含 10 种能力的数据素养核心能力框架:数据管理与组织、数据格式与数据类型、数据可视化、数据质量控制、数据发现与获取、数据分析、元数据、数据伦理、数据保存、数据复用,将数据管理素养集成到数据可视化课程中,根据学生的数据技能需求,有针对性地制定学习目标和评估方案;巴西里约热内卢联邦大学 A.Tygel 和 R.Kirsch 20基于教育学家 P.Freire 的素养模型定义了数据素养核心能力,包括数据读取(数据意识、数据发现与获取、数据收集) 、数据处理(数据处理技术、数据处理工具) 、数据交流(数据类型、数据格式、数据评估、数据伦理)和
14、数据生产(数据格式、数据发表工具)四种核心能力,用以指导和规范图书馆的数据管理课程;西班牙卡洛斯三世大学 P.Javier 和 M.粤忆.Marzal 等4从信息素养能力标准出发,选取美国学校图书馆员协会(AASL)制定的共同核心州立标准 、美国大学与研究图书馆协会(ACRL)制定的高等教育信息素养能力标准 、 科学与工程技术信息素养能力标准 、 人类学与社会科学信息素养能力标准 、 护理学信息素养能力标准 、 政治学信息素养能力标准 ,梳理其中有关数据管理的内容,结合图书馆科学数据管理服务,构建了包含数据意识(什么是数据、数据背景) 、数据发现和获取(数据来源、数据获取方法) 、数据阅7读理
15、解和评价(数据阅读与表达、数据评估) 、数据管理(数据和元数据的收集与管理) 、数据利用(数据操作、数据分析、数据使用伦理)五大指标的数据素养核心能力框架;瑞士 R.Schneider21在“全球信息素养研究与实践的共性与挑战”大会上指出科研数据素养和数据管理能力包括 8 个方面的内容,分别是数据识别、数据处理、数据计划、数据存储、数据保护、数据评估、数据管理、数据交流。国内学者也在构建数据素养能力体系方面取得了一定的研究成果。如上海大学的郝媛玲和沈婷婷5认为数据素养的核心内容包含五个方面的基本要素,分别是数据态度(数据道德观、数据价值观) 、数据意识(主体意识、获取意识、共享意识、更新意识、
16、安全意识、人才意识) 、数据知识(特点与类型、作用于效应、规律与规范、转换方式、搜索方法) 、数据技能(获取、处理、利用、展示、评价、再创造)和数据伦理(法制观念、数据安全、数据道德、知识产权) ,旨在为我国建立数据素养培养机制提供建议。 为了更深入展示国内外数据素养能力体系研究现状,笔者选取了美国普渡大学图书馆研究团队、加拿大达尔豪斯大学图书馆研究团队和国内华东师范大学团队构建的数据素养核心能力框架作为案例进 行详细介绍。 (1)普渡大学图书馆 普渡大学、康奈尔大学、明尼苏达大学和俄勒冈大学四校图书馆联合开展数据信息素养教育项目(DIL) ,以 Carlson.J 为代表的研究团队通过剖析
17、ACRL高等教育信息素养标准 ,访谈调研教师和学生的数据信息素养需求,并总结地理信息学等图书馆课程经验,构建了包含 12 项核8心能力的数据素养框架体系:数据实践规范、数据转换与互操作、数据监管和再利用、数据管理和组织、数据保存、数据处理和分析、数据质量和记录、数据可视化和表示、数据库和数据格式、数据发现和获取、元数据和数据描述、数据伦理与道德(见表 2) 。DIL 项目组在该能力框架的基础上,调研自然资源、土木工程、计算机科学等不同领域研究群体的数据需求,根据需求设计课程大纲展开针对性培训和教育,提高研究人员的数据管理能力6。 (2)加拿大达尔豪斯大学图书馆 加拿大达尔豪斯大学图书馆的 C.
18、 Ridsdale 等22学者在数据管理服务经验的基础上梳理出科研人员在数据管理过程中所需的数据素养能力,构建了包括数据管理概念、数据收集、数据管理、数据评估和数据应用五方面的数据素养能力矩阵(见表 3) ,拟在能力矩阵的基础上设计数据素养课程,帮助学校师生员工提高数据管理技能。 (3)华东师范大学隆茜 我国华东师范大学的隆茜23在综合国内外文献对数据素养内涵、组成能力的阐述的基础上,从数据意识、数据获取能力、数据处理与分析能力、数据交流能力、数据评价能力和数据道德六个维度构建了高校师生数据素养能力评价指标体系(见表 4) 。并以此为基础编制数据素养能力调查问卷,分析高校师生的数据素养能力现状
19、,为数据素养教育奠定基础。 笔者对以上 10 种数据素养能力框架进行梳理与解析,深入剖析能力框架的构成要素,共罗列了 21 种数据素养技能,分别是数据意识、数据9收集与创建、数据转换与互操作、数据管理与组织、数据保存、数据处理与分析(技术和工具) 、数据质量控制、数据可视化、数据类型、数据格式、数据发现与获取、元数据、数据伦理与道德、数据评估、数据利用与复用、数据共享、数据长期保存、数据安全、数据解读、数据引用、数据交流,各能力框架及其对应的数据素养技能(见表 5) ,这将为本文构建科研数据生命周期的数据素养核心能力框架提供参考和借鉴。 4 嵌入科研工作流与数据生命周期的数据素养能力框架 在考
20、察数据素养核心能力研究现状、总结科研工作流和科研数据生命周期的一般流程的基础上,本文梳理了嵌入科研工作流与数据生命周期的数据素养核心能力框架(见图 2) 。数据素养能力框架从科研工作流出发,包括项目启动前的数据管理计划;项目实施中的数据产生与收集、数据管理与组织、数据处理与分析、数据存储;项目结题时的数据发表与共享,以及项目结束后的数据发现与获取、数据再利用等 8 个生命周期阶段的 22 项数据管理能力。 (1)数据意识。数据意识是一个抽象的概念,具体来说,作为一名数据工作者,应理解什么是科研数据和为什么要管理科研数据等问题。科研数据是为了特定的目标所收集、观测、创建、分析的信息24。良好的数
21、据管理实践包含但不限于以下优点:提高研究成果的影响力,增加数据引用率;避免重复劳动,节省时间;确保研究成果可验证性和完整性;保证数据安全,降低数据丢失的风险;满足资助机构和学术出版商的数据管理要求;通过数据再利用,促进新的知识发现25。总体而言,数据管理贯穿科研项目始终,良好的科研数据管理实践是知识再生10的基础。规范化地管理科研数据,是确保数据长期保存和持久访问的关键,也是未来数据被其他研究人员理解和复用的前提。因此,研究人员在正式着手数据管理工作之前,应具备基本的数据意识。 (2)了解数据管理和共享的政策和要求。随着开放获取事业的推进,越来越多的资助机构(如美国国家科学基金委 NSF26、
22、美国国立卫生研究院 NIH27、美国航空航天局(NASA)28、英国研究理事会 RCUK29、经济合作与发展组织 OECD30) 、期刊出版商(如Nature、Springer、Wiley、Elsevier、RSC、ACS)以及研究机构(如JISC、ANDS、牛津大学、麻省理工学院、剑桥大学、康奈尔大学)纷纷发布数据管理政策,要求科研人员提交数据管理计划,规范科学数据管理流程31。在国内,2002 年科技部牵头建设“科学数据共享工程” ,目标是整合离散的科学数据资源,构建面向全社会的网络化、智能化的管理与共享服务体系32。为规范科学数据汇交和共享,2006 年科技部还制定了“国家科技计划项目科学数据汇交暂行办法” ,规定了汇交科学数据的种类及范围、数据汇交义务人的权利与义务等33。期刊出版商发布了相应的数据政策,如现代图书情报技术杂志要求从 2016 年起,所有投稿论文需要提交支持论文结论的科学数据,并通过适当方式供研究共同体或社会公众共享34。在从事科研工作时,研究人员有必要了解并遵守相应的数据管理政策和规范。 (3)制定数据管理计划(工具使用) 。许多资助机构明确提出了数据管理计划要求,如 2003 年美国国立卫生研究院发布数据共享政策,指出“所有向 NIH 申请经费在 500,000 美元以上的科研项目,建议但不强
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。