1、1基于 Citespace 的电子商务研究热点与研究趋势分析【摘 要】 本文通过分析 Web of Science 与知网的将近 7000 条数据,探讨电子商务领域的研究热点和发展趋势。使用 Citespace 软件,通过对施引文献进行词共现分析、作者合作分析以及对被引文献进行共被引分析,从而将电子商务的研究文献进行知识结构的可视化分析,借此来分析研究电子商务领域的研究热点及研究趋势。 【关键词】 电子商务 研究热点 研究趋势 1.引言 电子商务的发展具有明显的时期特点,国内外的诸多学者,从研究主题的不同角度,针对电子商务发展的各种要素和发展特征进行了大量研究。去的大多数文献资料的研究反面多是
2、较为分散的,不具有整体的结构性,对于新的发展主题很难把握研究的主题和前沿,也不便为后续的研究提供借鉴和帮助。可见,传统文献统计分析方法已经很难分析出电子商务学科内部的的结构化特征。 通过以知识单元为分析基础的知识计量学和科学知识图谱,从海量的文献数据和知识中,找到电子商务发展的关键性文献和知识前沿,是一种有效获取知识、发现知识和探索知识前沿的新领域与新手段1。 本次论文将使用 Citespace 软件,通过对施引文献进行词共现分析、作者合作分析以及对被引文献进行共被引分析,从而将电子商务的研究文献进行知识结构的可视化分析,借此来分析研究电子商务领域的研究主2题及研究趋势。 2.研究方法 为了分
3、析电子商务相关研究文献的知识结构和研究前沿,利用工具Citespace,对文献信息记录作者、参考文献、关键词以及作者机构,进行了针对施引文献词的共现分析、作者合作分析以及针对被引文献的共被引分析,通过对施引文献的合作图谱和共现图谱,以及针对被引文献的共引图谱,为未来电子商务领域的研究提供参考依据。通过国内外的横向对比,有助于我们明确我国电子商务发展水平与国际的差异。随着电子商务越来越全面的全球化发展,科学知识的交叉、融合、纵深的快速发展,新型研究领域和主题不断涌现,进行中外研究文献的对比,能有助于我们把握整体的发展结构,为未来的现实发展和文献研究提供帮助。 Citespace 是在 Java
4、的基础上开发的一个用来对信息进行可视化分析的软件,用它,可以知道一个研究领域的重要的文献、经典的文献、发展的前沿和热点等。本文通过将大量的电子商务的文献数据转换成可视化图谱,显示出科学知识的发展进程与结构关系,将知识单元或知识群之间网络、结构、互动、交叉、演化或衍生等诸多隐含的复杂关系通过图谱直观地展现出来2。 3.数据获取 首先选择 Web of Science TM 核心合集,时间为 2007-2016 年,检索为 e-commerce 主题 AND e-commerce 标题 OR e-business 主题 OR electronic e-commerce 主题 OR mobile e
5、lectronic commerce 主题 3OR cross-border e-commerce 主题 OR mobile e-commerce 主题,在以确保搜索到文献最后聚类时的结果不过于单一,以便能更好的体现研究的主题。最终的结果是 4268 条文献记录。中文数据的获取是选取的中国知网的 CNKI 数据库,最终搜索到 3621 条结果。 4.处理分析 1)格式化处理 通过 EndNote 文献管理软件的统计功能,将对从 WoS 数据库和 CNKI数据库中的数据结果进行一些简单的统计分析,将本次搜集的中外文献数据导入软件中,通过其功能 Tool 内的 Subject Bibliograp
6、hy,根据选择的关键词、出版商、作者、年份等,可以得出相应的统计结果。 2)Citespace 处理分析 本文使用的 Citespace 软件,一般默认选择 times slicing 为 1,即研究的图谱的时间间隔是一年,selection Criteria 中 Top N per slice 的 N,代表以一年为时间片段中被引频次最高的 N 个作者标识都会在图中显示。为了加快数据生成知识图谱的时间,Citespace 会对数据进行预处理,将数据导入到软件,进行数据格式转换之后,就可进行高效便捷的分析。 5.结果分析 3.1 研究热点分析 聚类研究,通过 CiteSpace 的自动聚类功能将
7、网络分成一系列不重合的子群,可以探究该研究领域热点话题,研究热点即指在一定时间内,数量相对较多且具有内在联系的一组文献所共同讨论的话题26。在对4数据进行聚类处理时,CiteSpace 软件默认将文献记录中的共被引文献聚类,并从施引文献中提取词集用于子群标识。选择 node types 的cited reference,在 selection Criteria 中 Top N per slice 选择为 50,代表以一年为时间片段中被引频次最高的 50 个被引文献都会在图中显示,生成文献共引网络图谱,然后进行聚类(选取的 clusters) ,通常选择来自于题目的标签词提取,算法用对数似然率算
8、法,研究 2007-2016 年间的研究热点话题,最终得到图 1 所示的聚类图。 聚类生成的上述表 1,共有四个知识子群,分别为#0 adoption、#1 trust、#2 performance 和#3 markets,四个子群的 silhouette 值都在 0.5 以上,silhouette 值越高说明其同质性越高,聚类效果越好。平均发表年限是该子群主题引用的文献出版时期的平均值。其中,最大的#0 子群,它的研究范围集中在消费者方面,共被引频次最高的两篇文章分别是 Perceived usefulness perceived ease of use and user acceptanc
9、e of information technology (Davis FD,1989)以及 User acceptance of computer technology: a comparison of two(Davis FD,1989) ,这两篇文章是关于介绍网购用户的对网络技术的接受问题的,该子群对主题消费者的研究多是引用了这些文章;其次是#1 子群,它主要涉及到了消费者对网购的信任度问题的研究,主要讲的是消费者对网购的信任度对其行为的影响;子群#2 的 silhouette 值仅为 0.585,说明子群同质性不高; #3 关注市场研究问题,被引频次最高的文章是 Frictionless
10、 commerce?a comparison of internet and conventional retailers(Brynjolfsson E 2000) ,主要讲的是互联网5经营方式与传统方式的比较。 3.2 发展趋势分析 为了保证研究结论的更准确性,在上述研究结论的基础上,将继续进行研究热点的探索,将 2007-2016 年的数据分成 2 个区间,即 2007-2011, 2011-2016,分别识别出这 2 个区间内的研究热点,从而得出电子商务的研究热点。利用 Citespace 分别绘制 2 个区间内的时间线视图,如图 2 所示。 在上图中,第一行的横线是时间轴,节点之间的弧
11、形连线的颜色由蓝到红表示 2007-2016 年,右边的红色文字是子群的标签词。上图中有很多具有紫色外圈的节点,这些节点都是关键节点,节点的中间中心性大于 0.1,它们是连接其它子群的桥梁。2007-2011 年如图 2(A)中,根据弧线颜色可以看出,#4 信任度的研究开始的较早,而#0 消费者研究则是从 2011 年开始的,其中#1 研究热点群中,关键的被引文献为 Gefen D, 2003, MIS QUART, V27, P51 和 Mcknight DH, 2002, INFORM SYST RES, V13, P334,说明了研究话题以信息系统方面的知识为转折点,开始关注信息化方面的
12、管理。2011-2016 年如图 2(B)所示,关于消费者的研究一直是研究的热点,#0 的信任度研究,关键的被引文献为 Gefen D, 2003, MIS QUART, V27, P51,David Gefen 是全球信息系统研究专家,其在信托研究上有着很大的代表性。综上,电子商务的研究热点是对于消费者的分析、信息技术方面的管理信息系统的研究。 结束语 本文利用 Citespace 软件对来自于 WOS 和 CNKI 两个数据库的中外文6献进行了可视化的网络图谱分析,通过合著网络、共引网络、聚类分析和关键词分析,得出:1)在对电子商务的研究子领域中,即消费者、互联网和信息系统三大研究人的,外
13、文文献对用户和网络技术方面的研究更多,相比起来,中文文献则更加侧重于对电子商务对不同领域的发展应用的研究以及消费者的研究,缺少对互联网技术方面的深入研究;2)消费者的分析、信息技术方面的管理信息系统方面的研究是近 10 年的研究热点和发展趋势。 【参考文献】 1 梁永霞.引文分析学知识图谱.大连:大连理工大学出版社,2012.1. 2 陈悦,陈超美,胡志刚,王贤文等.引文空间分析原理与应用Citespace 实用指南.北京:科学出版社,2014.9. 3 万湘容.基于 CitespaceII 的电子商务研究的知识图谱分析J.情报图书工作网刊,2012,53(4):21-24. 4 赵丹群.2012.基于 Citespace 的科学知识图谱绘制若干问题探讨J.情报理论与实践,35(10):56-58. 5 聂林海. 我国电子商务发展的特点和趋势J.中国流通经济,2014(6):97-101. 本文系浙江省自然科学基金项目 LY14G030022 的研究成果。