全球医疗大数据研究主题演化的文献学分析.DOC

上传人:天*** 文档编号:908745 上传时间:2018-11-06 格式:DOC 页数:5 大小:648KB
下载 相关 举报
全球医疗大数据研究主题演化的文献学分析.DOC_第1页
第1页 / 共5页
全球医疗大数据研究主题演化的文献学分析.DOC_第2页
第2页 / 共5页
全球医疗大数据研究主题演化的文献学分析.DOC_第3页
第3页 / 共5页
全球医疗大数据研究主题演化的文献学分析.DOC_第4页
第4页 / 共5页
全球医疗大数据研究主题演化的文献学分析.DOC_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

1、辽宁省大学生创新创业训练计划项目(项目编号:201710159000185)作者简介:幸韵(1997),女,山西省大同市人,本科生;郭书钰(1997-),女,山西省太原市,本科生;刘彦辰(1998),女,辽宁省大连市,本科生通讯作者 刘春鹤(1984),女,山东人,讲师,主要从事医学信息学等研究全 球 医 疗 大 数 据 研 究 主 题 演 化 的 文 献 学 分 析中国医科大学 幸韵 郭书钰 刘彦辰(1. 中国医科大学中英联合学院 辽宁省沈阳市 1100132.中国医科大学中英联合学院 辽宁省沈阳市 110013)图书馆情报2018年6月刘春鹤 讲师摘要 利用文献计量学的方法对全球医疗大数据

2、研究的相关文献进行分析,通过社会网络主路径分析、引文聚类等方式展示医疗大数据领域科研方向的发起、走向、演变特点、创新过程以及各类研究热点。以Web of Science中医疗大数据文献为例,利用HistCite精炼出核心文献;着重分析网络中的主题聚类、关键路径并识别网络中的权威和核心文献,期望为医疗大数据的演化与发展的研究提供支持。英文摘要 This paper uses the method of bibliometric to analysis the relevant literatures on global medical big data. By using main path a

3、nalysis and citation clustering, we shows the process of big data evolution, innovation, and research hotspots. Taking the literature on big data in WoS as an example, the core literatures of the field are refined with HistCite. We mainly analysis topic clusters, the critical path and identify the a

4、uthorities and core literatures of the network. Useful conclusions in this paper can provide a strong support for scientific knowledge evolution and development.关键词 医疗大数据;主路径;聚类;引文编年图;可视化分析 自“大数据”概念于20世纪90年代末被提出以来,伴随网络信息技术的飞速发展,大数据研究已逐渐覆盖了社会的各个行业,越来越多的医疗大数据研究应运而生。医疗大数据作为大数据中极其重要的一部分,不仅仅是医疗方面的数据信息,还包

5、括了卫生事业、生命健康数字化存储的海量数据 1 。现代医学已经进入了大数据时代,各类医疗大数据的处理分析结果给传统医学的发展方向提供了新的参考,为现代医学的发展方向带来了新的视角。经过20多年的探索研究,全球医疗大数据的理论研究有了长足的进展,尤其是2012年以来该领域的研究文献呈现指数增长,为本研究提供了丰富的数据基础。本研究将利用文献计量学和社会网络分析的方法对国内外各权威科技文献数据库中的医疗大数据相关科技文献进行处理分析,探寻20年来国内外医疗大数据研究的主题演化进程,梳理其发展脉络和阶段性研究热点,为医疗大数据理论研究发展提供全面的视角,为其未来的发展方向提供借鉴和参考。一数据来源与

6、研究方法本文的信息源为“Web of Science Core Collection”,采用两种检索策略: 以“big data”为主题词,精炼医学、药学、保健、流行病学、公共卫生、医学信息学等类别进行检索,检索出文献数据2 064篇;以“medic bigdata ”为主题词直接进行检索,检索出的文献数据为822篇,将两种检索策略所检索出来的数据结果取并集。下载从2003年到2017年11月的文献题录数据进行统计分析。题录数据包括标题、作者、摘要、来源出版物与参考文献等。利用HistCite引文分析工具研究医学领域文献的重要程度和互引关系,并对检索结果中高频文献进行可视化分析,生成可视化编年

7、图;运用大型社会网络分析工具Pajek进一步对编年数据进行主 路径分析,并对节点文献内容及节点的关联进行剖析。此外,本文对医疗大数据相关研究文献的热点也进行聚类等研究,使用Citespace 绘制可视化结果,并对医疗大数据领域的前沿热点、演化路径、研究内容进行分析。整体流程如图1所示:二结果与分析(一)利用HistCite进行重要文献被引频次的可视化分析 取本地引用次数前2285篇文献的本地引用次数进行可视化分析,得到引文编年图(见图2)。引文编年图不仅可以观察到某一学科专题的沿革与继承关系,还有可能发现这一专题研究在某一时间段内的发展程度 2。引文编年图以从上到下的空间顺序展示了由前到后的时

8、间顺序 3。从编年图来看,“医疗大数据”这个概念在2003年被首次提出,2013发文量呈上升趋势,尤其是2014年呈井喷之势 4。图2 中圆圈越大,表示被引用次数越多;不同圆圈之间有箭头相连,箭头表示文献之间的引用关系。可见,2013年第66篇,即T. B. Murdoch和A. S. Detsky发表的关于大数据在卫生保健中的应用 5成为了大数据应用在医疗卫生保健领域的开山之作;2014年第277篇,即D. W Bates.和S. Saria的 卫生保健中的大数据:使用分析识别和管理高危患者 6开创了降低医疗费用这一方面的探索;同年第210篇,即F.C. Fabricio的生物医学中的大数据

9、 7主要讨论了个性化医疗应用组学和临床健康数据中取得的重大突破,同时指出了在使用医疗大数据时所带来的挑战;第377篇,即R. Margolis等的BD2K:如何利用医疗大数据 8发起了一项 BD2K的倡议意在如何利用生物医学大数据创造最大价值。 (二)利用Pajek进行重要文献主路径分析进行主路径分析的目的在于将上述引文编年图简化,突出其中重要文献以及医疗大数据领域的发展主干以及变化过程。笔者将生成的含有2 000篇文献的非循环有向网络导入到Pajek中,首先运用SPC计算每一篇文献的遍历权值,该值反映了每篇文献在文献链中的重要程度,图3是利用Critical Path Method- CPM

10、 算法进行的主路径分析的结果。在引文网络中,主路径上的节点可以认为是领域发展的关键文献 9。主路径中共涉及 16篇节点文献,这 16篇文献为医疗大数据领 域中的核心文献。进一步分析,笔者发现这些主路径文献大多数研究医疗大数据在心血管疾病治疗、医疗保健中的应用。从主路径分析图来看,有两条主路径:其一是在图3主路径分析中编号为7 10的文献介绍了如何将大数据管理应用到医疗中并且比较了各种计算的不同模式,提供了云计算教程,属于整个医疗大数据的基础,开创性研究,是整个主路径的开端图 2 医疗大数据主题文献编年图图 3 医疗大数据主路径分析图 1 研究方法和流程。接着24号文献 11研究了大数据在应用到

11、生命科学领域所涉及到的挑战以及大数据未来的发展以及资金支持。121号 12以及122号 13文献开始研究大数据对疾病的诊断以及预测,开始从心脏超声成像中进行大数据采集,开创了医学动态数字时代。通过对心脏超声成像可视化结果的解释,提出了在医疗保健发方面对大数据技术方面的新要求。1248号 14文献其进行了大数据在心血管这一使人类最为困扰的疾病中的综述分析,指出了大数据在心血管疾病治疗及预防的应用前景,同时也指出了其面临的各种技术挑战。1484号 15文献和1480号 16文献为同一作者团队发表,均以大数据的视角,从制定者方面阐述了实现精准医疗的必要步骤,和从心血管方面向大数据能否实现预期目标提出

12、了发问。第1811号 17文献,即主路径的最后一篇核心文献,它系统的阐述了大数据对医疗健康所产生的革命性影响以及应用现状,最后展望了医疗大数据在心血管疾病治疗中的未来。其二是在主路径文献中,编号为66的文献系统地提出了大数据在医疗保健中的应用,指出大数据可以扩大新知识容量,帮助知识传播,可以应用在个性化医疗和临床实践,以及创建将系统的生物与电子病历的数据这说明了大数据的优势但同时也提出了隐私问题。然后的80号 18文献和285号 19文献都是对医疗大数据在医疗保健中的继续探索和学习,希望建立一个安全的医疗保健系统,为公众服务。其次,282号 20文献提出建立 4个健康数据网络,即医疗产品安全,

13、疗效比较研究,卫生保健系统,网络公共卫生监测。从这4个方面来看,大数据网络在医疗方面具有无限的潜力。546号 21文献是利用数学和统计方法对世界范围内的数据进行统计和分析,对疾病进行合理预测。547号 22文献在医疗保健研究中应用了动态仿真建模方法,进一步为医疗保健系统的优化提供参考。1037号 23文献是研究转变医疗保健交付:将动态模拟模型和大数据纳入卫生经济学和成果研究。1740号 24文献是个性化医学经济评价和在数字在医学中的应用。 根据上述主路径分析可知,目前大数据已经在指导精准医疗、个性化健康保健、临床决策支持、疾病的诊断与预测方面发挥了积极作用。未来应在心血管疾病的治疗和预防、医疗

14、保健中经济价值这两个方面进行深入研究,其相关成果也将对传统医学、临床医疗领域产生革命性的影响。(三)利用Citespace进行聚类得出研究热点为了对医疗大数据领域的前沿热点、演化路径、研究内容进行分析,本研究选择节点类型为“term”进行共词分析。Citespace软件中的term表示文章的关键词,使用term分析要比关键词分析更深入到文本内容,反映出来的信息也更全面。研究选择寻径(pathfinder )和修剪切片网络对整个网络进行修剪,然后聚类得到聚类标签视图(见图4)。Pathfinder算法是一种有效的网络简化和分解的方法,适用于有向和无向加权网络 25。共词图谱形成了14个主要聚类,

15、代表2003-2018年大数据的主要研究领域。本文取分析节点数相对较多、信息量大的前5个聚类。 聚类0,包括可视化(visualization )、云计算(cloud computing)、信息学( informatics)、生物信息学(bioinformatics)等关键词,对大数据的研究集中在网络技术方面。聚类1,包括电子健康档案(electronic health record)、电子病历(electronic medical record)、系统医学( systems medicine)、全基因组关联( genome wide association)等关键词,对大数据的研究偏向临床数

16、据采集和数据网络构建。聚类2,包括前列腺癌(prostate cancer)、结直肠癌(colorectal cancer)、乳腺癌( breast cancer)、瘤(tumor)等关键词,是大数据在临床的应用以及对癌症等一些疾病的预测。聚类 3,包括项目(program),公共卫生(public health) ,诊断(diagnosis), 追踪( trail)等关键词,主要聚焦大数据在公卫方面的作用。聚类4,包括机器学习(machine learning),预测( prediction),虚拟筛选( virtual screening),功能连接(functional connecti

17、vity)等关键词,关注基于机器及人工智能在诊断医疗疾病方面的作用。 聚类5,包括心血管疾病(cardiovascular disease)、血压( blood pressure)、冠状动脉疾病(coronary 图 4 医疗大数据自动聚类标签视图artery disease)、心脏衰竭(heart failure)等关键词,是大数据在心血管疾病方面的应用和对未来的预测。后面的若干类分别涉及公共政策、流行病学、临床试验等的研究,但与前几个聚类相比较节点数较少,难以构成全面集团进行具体分析,有待今后文献数量的进一步增加累积。三讨论运用软件HistCite,、Pajek和Citespace,以医疗

18、大数据文献为对象,较直观地展现了近10余年来Web of Science数据库中医疗大数据研究的热点和前沿。研究结果表明:(1)关于核心文献的描述。通过HistCite可视化分析,根据本地被引次数,核心文献的主要内容均为医疗大数据在生物医学和卫生保健领域中的应用。(2)基于领域主路径结构分析。采用SPC算法,对众多文献按照时间顺序进行筛选,从而得到了最具有代表性的文献,并绘制了医疗大数据的演化路径。与此同时,指明了此领域的研究热点。总体来看,主路径指示出了两个方面的研究成果:其一为大数据在心血管疾病中的治疗作用;其二为医疗大数据在卫生保健以及个体医疗方面的发展以及应用。(3)医疗大数据文献热点

19、聚类分析。本文对检索文献结果进行聚类,对14个子类中最重要的6个大子类进行逐个分析,从整体上把握医疗大数据的研究热点及脉络。研究结果可初步预测未来医疗大数据将普遍应用于临床诊断、公共卫生、医疗保健、个性化医疗等方面,未来研究还将继续深入探索网络技术在数据采集、网络构建等方面进行逐步完善。参考文献1刘芳, 卢国强, 刘畅. 大数据视角下医院信息管理与信息系统专业建设研究J. 电子技术与软件工程, 2016(6):170-170.2李运景,侯汉清,裴新涌. 引文编年可视化软件 HistCite介绍与评价J. 图书情报工作,2006,50(12):135-138. 3闫雷,关晶,崔雷. 基于 His

20、tCite 的抗疟药研究相关文献引文编年图和主要路径J. 医学信息学杂志,2012,33(9):51-54. 4兰国帅, 张一春, 王岚. 国内外教育技术新发展基于WOS与Histcits知识图谱可视化分析J. 开放教育研究, 2014(3):111-120.5 MURDOCH T B, DETSKY A S. The inevitable application of big data to health care.J. Jama, 2013, 309(13):1351.6 BATES D W, SARIA S, OHNO-MACHADO L, et al. Big data in heal

21、th care: using analytics to identify and manage high-risk and high-cost patientsJ. Health Affairs, 2014, 33(7):1123.7 COSTA F F. Big data in biomedicineJ. Drug Discovery Today, 2014, 19(4):433.8 MARGOLIS R, DERR L, DUNN M, et al. The National Institutes of Healths Big Data to Knowledge (BD2K) initia

22、tive: capitalizing on biomedical big dataJ. Journal of the American Medical Informatics Association Jamia, 2014, 21(6):957.9LIU Y X, RAFOLS I, ROUSSEAU R. A framework for knowledge integration and diffusionJ. Journal of Documentation,2012,68(1):31-4410SCHADT E E, LINDERMAN M D, Sorenson J, et al. Co

23、mputational solutions to large-scale data management and analysisJ. Nature Reviews Genetics, 2010, 11(9):647-657.11 KOLKER E, STEWART E, OZDMIR V. Opportunities and Challenges for the Life Sciences CommunityJ. Omics A Journal of Integrative Biology, 2012, 16(3):138-147.12 SENGUPTA P P. Intelligent P

24、latforms for Disease Assessment : Novel Approaches in Functional EchocardiographyJ. Jacc Cardiovascular Imaging, 2013, 6(11):1206-11.13 NARULA J. Are we up to speed?: from big data to rich insights in CV imaging for a hyperconnected world.J. Jacc Cardiovascular Imaging, 2013, 6(11):1222-4.14 RUMSFEL

25、D J S, JOYNT K E, MADDOX T M. Big data analytics to improve cardiovascular care: promise and challengesJ. Nature Reviews Cardiology, 2016, 13(6):350.15 GdROENEVEL P W, RUMSFELD J S. Can Big Data Fulfill Its Promise?J. Circulation Cardiovascular Quality Studies in knowledge organizationM. New York; Ablex P

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 1

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。