1、本科毕业设计论文届论文题目科学知识图谱在学科评价中的应用研究所在学院专业班级信息管理与信息系统学生姓名学号指导教师职称完成日期年月日诚信声明我声明,所呈交的论文设计是本人在老师指导下进行的研究工作及取得的研究成果。据我查证,除了文中特别加以标注和致谢的地方外,论文设计中不包含其他人已经发表或撰写过的研究成果,也不包含为获得或其他教育机构的学位或证书而使用过的材料。我承诺,论文设计中的所有内容均真实、可信。论文设计作者签名签名日期年月日授权声明学校有权保留送交论文(设计)的原件,允许论文(设计)被查阅和借阅,学校可以公布论文(设计)的全部或部分内容,可以影印、缩印或其他复制手段保存论文(设计),
2、学校必须严格按照授权对论文设计进行处理,不得超越授权对论文(设计)进行任意处置。论文设计作者签名签名日期年月日科学知识图谱在学科评价中的应用研究摘要进入新世纪以来,科学知识图谱与知识可视化得到迅速的发展,已在各个学科中得到广泛的应用。本文借助科学知识图谱的方法和实例,来展示和分析科学知识图谱的基本概念、发展历程、前沿领域、主要方法和类型以及在学科评价领域中的应用。关键词科学知识图谱知识地图学科评价SCIENTIFICKNOWLEDGEMAPINDISCIPLINEEVALUATIONABSTRACTINTHENEWCENTURY,SINCESCIENTIFICKNOWLEDGEMAPANDKN
3、OWLEDGEVISUALIZATIONHAVEDEVELOPEDRAPIDLY,SOITHASBEENWIDELYUSEDINVARIOUSDISCIPLINESTHISPAPERDESCRIBESTHEBASICCONCEPTSANDTYPES,HISTORYANDDEVELOPMENT,FRONTIERAREASOFSCIENTIFICKNOWLEDGEMAP,ANDANALYZESHOWTOAPPLYITINDISCIPLINEEVALUATIONASWELL,WITHTHEHELPOFSCIENTIFICKNOWLEDGEMETHODSANDINSTANCEKEYWORDSSCIEN
4、TIFICKNOWLEDGEMAPKNOWLEDGEMAPDISCIPLINEEVALUATION目录1绪论12科学知识图谱的基本概念与特征221科学知识图谱的基本概念222知识图谱的特征2221知识图谱是信息可视化的一个分支2222知识图谱是知识管理中数据挖掘和知识发现的有效手段23科学知识图谱的历史背景及国内外现状431科学知识图谱的发展历程432我国科学知识图谱的现状44科学知识图谱的工作流程与基本方法641科学知识图谱的工作流程642科学知识图谱的基本方法6421引文分析6422耦合分析6423聚类分析75科学知识图谱类型及其在学科评价中的应用851科学知识图谱类型8511多维尺度图谱
5、8512社会网络分析图谱8513时间线知识图谱8514多视角共引网络知识图谱952科学知识图谱技术在学科评价中的应用背景953科学知识图谱技术在学科评价中的应用10531共词分析与学科评价10532多元统计分析与学科评价10533词频分析与学科评价11534社会网络分析与学科评价1154在学科评价中所应用到的科学知识图谱方法实例分析11541学科结构及发展特征评价11542学科内科学实体评价12543学科的科学生产力评价12544学科影响力评价13545学科发展趋势评价13546学科可用资源评价13547学科发展目标评价13548学科教学评价146结束语15致谢16参考文献17本科生毕业论文(
6、设计)11绪论从人类出现开始,人们就有意识地不断归纳、总结及描绘已经发现的科学知识。随着信息技术的发展,人们获取的信息和需要处理的信息增加。人们通过应用信息可视化技术,对文献及进行自动分类,绘制各种形式具有知识导向的知识地图,逐渐发展出来一个新领域科学知识图谱。科学知识图谱是揭示科学知识的发展进程与结构关系的一种图形,是科学计量学十分有前景的研究方向。虽然我国对科学知识图谱研究起步较晚,但根据对陈超美教授关于可视化软件CITESPACE的网站访问统计,2008年我国访问率占全球总访问率的3234,排在世界第二位,而2009年我国访问率占总访问率的3829,攀升为世界第一。这些数据从一定程度上说
7、明,科学知识图谱已引起我国学者的广泛关注。近年来科学计量学、文献计量学研究领域热点之一,就是如何在准确翔实地传达知识的基础上,以可视化的图像直观形象地向人们展示学科之间的联系。本文研究了科学知识图谱的基本概念、发展历程、前沿领域、主要方法和类型以及在学科评价领域中的应用。本科生毕业论文(设计)22科学知识图谱的基本概念与特征21科学知识图谱的基本概念科学知识图谱(MAPPINGKNOWLEDGEDOMAINS)是引文分析和可视化技术相结合的产物。它以科学知识为计量研究对象,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系,是显示科学知识的发展进程与结构关系
8、的一种图形,属于科学计量学SCIENTOMETRICS的范畴1。建立在引文分析和信息可视化相结合的基础上的知识图谱是科学计量学的发展和创新的产物,它在数学方程式表达科学发展规律的基础上进而以曲线形式将科学发展规律绘制成二维图形。科学知识图谱可视化地描述人类随时间拥有的知识、资源及其载体,在组织内创造知识共享的环境以促进科学技术研究的合作和深入。其描述的对象主要包括从事科学技术活动和作为知识载体的人,显性或编码化的知识,以及其过程或方法。因此,科学知识图谱既是可视化的知识图形,又是显示了知识元或知识群之间网络、结构、互动、交叉、演化或衍生等诸多复杂的关系的序列化的知识谱系。科学知识图谱包括新自组
9、织图谱、前景图、散点图、链接节点图、时间序列图谱和3D显示图等。科学知识图谱与科学知识地图的概念存在本质上的差异。知识地图使无序的知识信息变得有序,提高了知识的利用率,构建了知识间的关系,它只能表现科学活动以及知识分布状况。知识图谱从一个真正动态发展的知识结构描述一系列地图在一定时间、一定范围内的发展和变化,不仅能展现学科内、学科问知识的现状、发展和完善,更能揭示知识之间的联系及知识的进化规律,是处在不断的更新和扩展的状态中。22知识图谱的特征221知识图谱是信息可视化的一个分支信息可视化是利用计算机支撑对抽象数据进行可视化表示。知识可视化是将数据挖掘和知识发现等方法所获得的知识的构成、知识之
10、间的逻辑关系、具有复杂结构的知识等各种知识和规律用可视化的方法表现出来,使知识易于理解。知识图谱又被称为知识领域可视化,利用信息可视化技术,根据共引分析、共现分析等理论基础,构建的一种知识之间关系的网络图。知识图谱以文献等信息为节点、以它们之间关系为边的图形,包含了链型、树型、网型等结构。这种方法可以扩展到深层次的知识发现和数据挖掘领域。知识图谱可以是静态的关联、聚类、分类知识,也可以是反映系统演化规律的知识。因此,知识图谱属于信息可视化的一个重要分支2。222知识图谱是知识管理中数据挖掘和知识发现的有效手段知识管理通过整理分散、复杂、难以理解的信息单元,提供容易使人们理解和使用的知识,系统化
11、地处理和利用信息,发掘知识内涵,建立以先进信息技术为基础的知识管理系统,促进知识的广泛共享。数据挖掘是从大量数据中挖掘隐含的、前所未知的、具有潜在价值的蕴含数据间关系,本科生毕业论文(设计)3揭示价值的知识或规则。数据挖掘的主要模式有聚类、序列模式、分类等。聚类是按照同一类别的个体差距尽量小,而不同类别的个体差距尽量大的原则,将把一组个体按照相似属性分类;序列模式是指对数据间的前后序列关系进行分析排序;分类则是为一个事件或对象归类。知识图谱就是将数据挖掘和知识发现的有关方法和模式移植过来。它研究大量、不完全、模糊、随机、事先未知的数据的共引、共现关系,采用关联、序列、聚类、分类等方法深层次的分
12、析,自动、有效、智能地提取隐含于其中的有用信息和知识。知识图谱的应用于发现科学理论和方法的历史演变过程,这是通过对知识图谱的引证关系挖掘分析发现;学科结构特点、研究热点、发展源流、专业相关程度以及突破性成就、未来发展方向等可以对按年代分布所构成的历史图和网状关系进行共现、共引、耦合关系进行研究中找到2。总之,知识图谱是知识管理中数据挖掘和知识发现的有效手段,在揭示信息关联及规律方面具备其他许多方法不可比拟的优越性和独到之处。本科生毕业论文(设计)43科学知识图谱的历史背景及国内外现状31科学知识图谱的发展历程在科学计量学研究中,传统的研究科学学科领域发展规律的方法十分耗时耗力学者们必须查阅该领
13、域的海量文献来了解一个学科领域发展的整体状况。很显然这里面会掺杂主观的判断,而且既费时又困难,难以重复进行。因此,科学计量学家们一直努力在寻找一种同传统方法相比,具有更客观、科学、有效的新方法来研究科学学科的结构与进展。20世纪30年代,在科学的社会功能这部奠基性著作中,贝尔纳不仅为科学学,而且为科学计量学提供了基本的研究范式以及美国著名科学社会学家ROBERTKMERTON的博士论文十七世纪英格兰的科学、技术与社会辅以直观可视的图表,对职业、科学和技术的兴趣转移进行了计量分析3。普赖斯在科学的科学一文中,论证了“贝尔纳分析科学时的三大特点定量研究、理论模式、政策与管理研究”4。在普赖斯的科学
14、计量学成就中,第一个标志性成果是他发现的科学发展指数规律,把科学定量研究的方法引入科学学,使科学学变更为成熟。从此,以科学计量学为基础的科学学理论与应用研究成为主流,并且在贝尔纳科学学范式下,引发了科学计量学从历史分析到引文分析的重大转向。科学知识图谱就是在在引文分析理论、复杂网络与社会网络分析理论、信息可视化技术的推动下,逐渐成为国内外科学计量学一个崭新的研究热点。严格意义上以引文分析方法和信息可视化技术为基础的的科学知识图谱经历了三个发展阶段。1引文分析理论的发展促进了科学知识图谱的兴起。不断丰富和发展引文分析的理论基础,深化和扩大多元统计方法在科学计量学中的应用。2复杂网络系统和社会网络
15、分析的兴起丰富了引文分析理论与方法。社会学中社会网络分析和统计物理学中复杂网络分析的兴起及其在引文分析领域中的应用,开辟了科学知识图谱与知识可视化的新途径。计算机技术与一系列网络分析软件的发展,为复杂网络和社会网络技术在引文网络研究的结合于应用创作了条件。3信息可视化为科学知识图谱提供了强大的技术支持。信息可视化技术的成熟以其在社会网络分析中的应用,并把科学计量学推进到知识可视化为标志的新阶段。1999年陈超美出版了该领域的第一部学术专著信息可视化与虚拟环境,标志着信息可视化技术发生重大转折的时期,之后相关研究如雨后春笋般涌现。陈超美创造性地把信息可视化技术和科学计量学结合起来,开发的CITE
16、SPACE系列应用软件,形成了适于多元、分时、动态的复杂网络分析的新一代信息可视化技术,把对科技情报的知识计量和知识管理研究推进到以知识图谱与知识可视化基础的新阶段5。32我国科学知识图谱的现状改革开放以来,我国科学学、科学计量学、管理学与情报学信息科学等领域注重学科建设,得到迅速的发展。然而,由于科学知识图谱绘制系统开发及引文数据获取的不易,对专业人员不仅要求具备丰富的学科背景,同时也要求使用者能熟练掌握绘制技术等问题的存在使得国内在知识图谱的应用方面缺少理论上的实证分析,主要是将知识图谱作为一个工具,应用于各个领域,其应用本科生毕业论文(设计)5研究还比较薄弱。但是由于知识图谱是科学计量学
17、领域的一个新的活跃分支,其历史还比较短,所以国内外在知识图谱的应用研究方面,差距并不大6。从2O世纪90年代至今,科学学、科学计量学和情报计量学以及专门的研究机构如大连理工大学的科学学与科学技术管理研究所等一直在加强与世界学术同行的国际交流和合作研究,关注科学知识图谱的研究和发展,取得了一系列研究成果,保持着应有的学科地位。如社会科学院的李思经在知识图谱具体构建知识图谱系统方面深有研究,他的学生康永兴构建了学科知识图谱系统,将其应用于科学;中国科学院的耿海英毕业论文用共引分析方法等绘制了情报学作者间知识图谱,并和WHITE的结果进行对照,分析异同;大连理工大学科学学与科学技术管理研究所的刘则渊
18、老师等是纯科学知识图谱绘制方面研究的专家6。陈朝美认为深入地进行科学知识图谱的理论和实践研究将是今后研究中的一个热点问题。他发表的情报学中的权威与热点一个多视角共引分析,集成了网络分析、可视化、信息提取和自动文本提要等多种技术手段在CITESPACE22R2新版软件创建了一种多视角共引分析方法,该方法综合了视觉的、分析的和语言的多样化角度。该文中主要使用隐性语义索引、寻径网络、虚拟现实技术来进行作者共被引分析7。从此,知识图谱与知识可视化的方法迈向多元、历时、动态。科学知识图谱的理论、方法与应用提高到一个新水平。如今,科学知识图谱作为科学计量学领域的一个新兴研究方向,已经得到了很多科研人员的肯
19、定,成为一种热门的理论与方法,其应用领域也在不断的拓展,我们相信,在不久的将来,科学知识图谱理论与应用将会得到进一步的发展,我国也将会加入到科学知识图谱方向的研究及应用的世界前沿之列。本科生毕业论文(设计)64科学知识图谱的工作流程与基本方法41科学知识图谱的工作流程科学知识图谱分析单位(文献、科学家、关键词等的相似性分析及测度,是科学计量学和信息计量学的新发展。它以科学学为基础,涉及应用数学、信息科学及计算机科学诸学科交叉的领域。目前科学知识图谱的方法多种多样,可以根据具体不同的方法和技术可以绘制不同类型。对于各类知识图谱普遍适用的绘制一般工作流程借助以引文分析为主流的科学计量学基本方法和信
20、息可视化的技术手段,从科技情报数据库中有目的地发掘某一领域的数据,把数据变为可视化的图谱。最后通过对图谱的剖析和解读,转化为有意义的知识。图谱的剖析和解读是为了使知识图谱有效地把数据转化为知识,从大量数据背后潜藏的隐性知识直观地展现为显性知识。42科学知识图谱的基本方法国际上构建学科知识图谱有使用沃德方法和K值算法(FJANSSENS等对选中的五种期刊分析);有使用PFNET方法和卡分类方法(KWMCCAIN等绘制软件工程域作者地图);也有文献计量方法(ESANZCASADO等对朊病毒领域的现状以及发展趋势的研究)。总的来说,科学知识图谱的主要方法分为科学计量学基本方法和信息可视化技术手段。而
21、本文由于篇幅所限,只对知识图谱的科学计量学基本方法进行简单介绍。421引文分析引文分析CITATIONANALYSIS是指利用数学、统计学和比较、概括、归纳等方法对科学期刊、论文、作者等各种对象之间的引用与被引用关系进行分析,以揭示分析对象内存在的数量特征和内在规律的一种文献计量研究方法。由此派生出相关的共引分析、共词分析、耦合分析等方法,引申出引文网络分析、知识图谱方法等等,乃是引文分析应有之义。而目前引文分析及其派生方法(如共引分析COCITATIONANALYSIS)已成为科学计量学的主流方法。由于共引分析指的是一组文献(被引文献)共同被同一篇或同一组文献(施引文献)引证,则被引证的前一
22、组文献形成共引关系。因此,共引分析具有动态性、持续性,有滞后性。如果再借助分析施引文献反映的研究前沿加以弥补,使得这种基于共引分析的知识图谱可以更好的展现知识的结构关系与动态变化。美国科学情报研究所ISI名誉所长加菲尔德EGARFIELD为首的科学团体创建了一系列关于知识域资料数据库,就是将引文分析方法用于知识图谱的绘制中的应用实例。在国内,河南科技大学经济管理学院秦长江就是基于期刊共引分析法,在基于期刊共引分析法的学科关系知识图谱的实证研究一文中,利用社会网络分析和PAJEK软件,构建中国农史学科与相邻学科关系知识图谱,分析农业史学科与相邻学科的关系,为基于期刊共引分析的学科关系知识图谱的进
23、一步研究提供具体的案例。422耦合分析耦合分析(COUPLINGANALYSIS)一组文献(施引文献)同时引证另外同一篇或同一组网络环本科生毕业论文(设计)7境下的信息与情报研究专刊文献(被引文献),则前一组文献形成耦合关系。它又引申出作者、期刊、学科的耦合分析等。耦合分析的实质,在于一组施引文献即耦合文献对被引文献的知识共鸣和知识吸收,直接呈现以被引文献为知识基础的领域的研究前沿7。由于文献耦合分析立足于施引文献的耦合关系,而施引文献引证的文献在发表时就是固定的,因此耦合分析具有实时性,也必然具有静态性。423聚类分析聚类分析(CLUSTERANALYSIS)基于事物及其属性相似性的一种事物
24、分类方法。它把没有分类信息的资料按相似程度规类,是知识发现和数据挖掘中的一个重要工具,属于降低维数技术的范畴,是科学计量学和文献计量学的一个基本方法。聚类分析是一种数据挖掘的重要手段。它通过把文本变换成词向量来聚类的方法,将词条标以不同的权重值,这样一篇文献就由词条的权重值组成的特征向量来表示,然后在此基础上开展各种文本聚类的研究。文献聚类分析根据引文的不同特征,进行引文的分群聚类和分析研究,(这是聚类分析技术在引文分析领域的具体应用)在聚类分析的网络图或树状图中可以分析求出需要预测判断的目标研究发现8。聚类分析是最常用的多元统计方法之一。通过引文聚类分析,特别是从引文间的网状关系进行研究,能
25、够探明有关学科之间的亲缘关系和结构,划定某学科的作者集体,分析推测学科间的交叉、渗透和衍生趋势,还能对某一学科的产生背景、发展概貌、突破性成就、相互渗透和今后发展方向进行分析,从而揭示科学的动态结构和某些发展规律。侯海燕,刘则渊,陈悦,姜春林,尹丽春,庞杰等人为了展示近1O年来国际科学学研究的热点领域及其发展态势,而绘制出了全新的国际科学学研究热点演进趋势知识图谱,就是借助聚类分析的方法,通过共被引分析得到文献的共被引矩阵,使用多维排列分析MDS功能绘制出文献共引图谱,然后通过聚类分析划分出不同的学术研究领域。本科生毕业论文(设计)85科学知识图谱类型及其在学科评价中的应用51科学知识图谱类型
26、目前信息可视化技术正突飞猛进,而科学知识图谱类有以下几种主要类型511多维尺度图谱多维尺度图谱(MULTIDIMENSIONALSCALINGMAPPING)是用多维尺度分析(多维尺度分析(MULTIDIMENSIONANALYSIS)通过某种非线性变换,近似地保持原高维数据间的关系的前提下,把高维空间的数据转换成低维空间中的数据,是多元统计方法之一。)为基础的知识图谱。多维尺度分析用于反映多个研究事物间的相似性程度,通过适当的降维方法,将这种相似程度在低维度空间中用点与点之间的距离表示出来,并有可能帮助识别那些影响事物间相似性的潜在因素。多维尺度知识图谱可以对一个学科领域的主流领域或主流学术
27、群体进行划分,其显示结果十分直观和形象。在科学知识图谱中文献的位置显示了他们之间的相似性,有高度相似性的文献聚集在一起,形成学科前沿。并且,处于中间位置的文献与其他的联系越多,在某学科里的位置也越核心,反之则越处于外围。这样。一个研究领域、思想流派或其他学术共同体在学科里的位置就很容易通过多维尺度分析判断。自1997年起,美国德雷塞尔大学信息科学技术学院科学计量学家怀特HOWARDDWHITE和麦肯KWMCAIN、荷兰莱顿大学科学技术学中心的诺恩斯ECMNOYONS、冯雷恩VANRAAN,AFJ、梅德MOED,HF等人都用多种多元统计分析和共被引分析相结合,采用相关的统计绘图软件,进行研究建立
28、基于多维尺度分析的知识图谱方法。512社会网络分析图谱社会网络分析(SOCIALNETWORKANALYSIS)是社会学中把社会群体关系视为社会网络关系,进行社会计量的一种分析方法。社会网络分析图谱(SOCIALNETWORKANALYSISMAPPING)是将相关的可视化技术与社会网络分析、统计物理学中的复杂网络系统分析相结合,并将其用于引文分析或共现分析网络的知识图谱9。社会网络分析以美国社会心理学家MORENO创立的社会测量法为社会网络分析为基础,如今已被广泛应用于网络社会关系发掘、支配类型发现以及信息流跟踪,通过社会网络信息来判断和解释信息行为和信息态度。20世纪90年代,德国科学计量
29、学家H克雷奇默HKRETSCHMER把社会网络中人际关系结构理论和格式塔心理学的构型理论相结合,构建描述社会网络构型的非线性函数,用以分析科学合作问题,取得了多项成果,并描绘科学合作网络构型的三维空间模型,形成了独具特色的一种科学知识图谱与可视化图像。在国内,社会网络分析法广泛应用于社会网络分析法在引文分析、合著分析、科研协作网、学科研究趋势、专家知识地图、创新研究、科研团队知识共享等。513时间线知识图谱时间线知识图谱(TIMELINEKNOWLEDGEMAPPING)通过耦合分析方法对文献进行聚类分析,本科生毕业论文(设计)9在原来时间线图谱的基础上,对可视化图谱的方法作出了改进,将二维时
30、间线图谱扩展为三维地形式图谱,用可视化技术把聚类的耦合文献按时间序列展现出来的知识图谱。它是计量分析中的可视化分析方法上实现重大突破,使得从全新维度观察、描绘并预测科学研究前沿的动态发展趋势成为可能,是科学知识图谱领域的一个新兴方法。时间线与地形式可视化图谱可以为特定的学科领域确定研究前沿,清晰展现随时间变化而变化的研究前沿发展脉络,准确掌握学科研究前沿热点,层次清晰结构明了。还可以描绘出不同研究前沿领域之间的信息流动关系。由于时间线与地形式可视化方法可以实现不同的研究目的,具有很强的灵活性和针对性。它处理数据的数量相对较多,可以实现其他可视化方法无法实现的功能,在学科评价上得到广泛的应用。如
31、大连理工大学WISELAB实验室的张婷在时间线和地形式可视化图谱科学传播研究前沿演进趋势分析中绘制出更清晰可视化并具有动态性的科学传播研究前沿的发展趋势有关图谱为预测学科发展,对科学传播的研究前沿进行了可视化地梳理和描述,就是运用时间线和地形式可视化图谱的方法对研究前沿进行描绘,由三维动态地形式图谱取代原来的二维时间线图谱,随着时间变化来演示科学传播领域研究前沿的动态变化过程与发展趋势10。时间线与地形式可视化知识图谱还处于尝试和探索阶段,还需要继续完善,应充分利用其数据库的特性,突破数据语言和类型的限制,为未来科学知识可视化及不同国家科学知识研究形势的对比提供更大的发展空间和新思路。514多
32、视角共引网络知识图谱多视角共引网络知识图谱(MULTIPLEPERSPECTIVECOCITATIONNETWORKMAPPING)是国际科学计量学领域前沿可视化技术绘制科学知识图谱的方法之一。陈超美开发的CITESPACE软件就是应用多视角共引网络知识图谱。大连理工大学人文社会科学学院的赵玉鹏,刘则渊,许振亮在基于知识图谱的美国科学哲学研究前沿和热点探讨中根据美国科学情报所提供的SCI科学引文索引数据,利用科学计量学原理,对科学哲学进行研究,进而用CITESPACE软件绘制出相应的多视角共引知识图谱11。此外,侯剑华,陈悦的战略管理学前沿演进可视化研究一文中应用它对战略管理月刊STRATEG
33、ICMANAGEMENTJOURNA1中的19802005年文献数据进行可视化分析,由此对战略管理学领域的前沿及其演化进行初步探讨12。52科学知识图谱技术在学科评价中的应用背景知识图谱最早是在科研领域活跃起来的。1995年,内容分析、聚类分析等高级文献计量指标在比利时政府用文献计量方法评估比利时微电子中心IMEC19841995年的科研活动的首先得到应用。1989年,WHITE和MCCAIN将情报学分为两个主要领域文献计量学包括引文分析和情报检索;1997年,怀特和麦肯恩对引文分析的发展历程和其在文献可视化方面的应用作了清晰的叙述。鲍格曼和弗莫对能够用于信息评价、解释、预测和学术评价的文献计
34、量学方法进行了描述。维尔森对信息计量学,包括文献计量学研究和其他的矩阵研究方法作了全面的综述。此外,WHITE和MCCAIN再次采用科学知识图谱方法和技术,研究情报学领域的结构特征和24年来的发展情况。DINGY等利用科学知识图谱方法技术研究了信息检索领域的智力结构。TSAYMY等利用科学知识图谱方法技术研究了半导体科学领域的学科结构及主流学术群体和权威科学家。ACEDOFJ等利用科本科生毕业论文(设计)10学知识图谱方法技术研究了国际管理领域IM的智力结构。NERURSP等利用科学知识图谱方法技术研究了战略管理领域的智力结构。相对国外而言,国内的研究起步较晚,但也取得很多成果。下面,就对几种
35、代表性的知识图谱方法在学科评价上的应用作了简单描述。53科学知识图谱技术在学科评价中的应用现代科学发展迅速,即使是科学家也不能清楚地阐明学科的价值,科学知识图谱等文献计量方法则可以提供学科领域组织性、结构性较强的描述数据,弥补定性评价在内容上的局限,知识图谱方法成功的解决了这一问题。这里,简要阐述几种代表性的可视化技术与知识图谱类型,以及它们在学科评价中的应用,所涉及的方法包括引文分析法、共词分析、多元统计分析等。531共词分析与学科评价共词分析主要是对一组词两两统计它们在同一篇文献中出现的次数,以此为基础对这些词进行聚类分析,生成共词文献簇,进而分析这些词所代表的学科和主题的结构变化。它属于
36、内容分析法的一种。在学科评价邻域,共词分析就是通过对相关文献的代表性术语之间的连接强度的分析,共绘制这些代表性术语之间的概念图谱或知识网络结构,通过一系列图谱分析就可以相当详细地描述某一学科领域的主题。利用共词分析法及其相关的可视化方法可以进行深入的主题分析,可以了解学科结构和发展状况,还可以进行学科发展预测。由于共词分析利用大量文献中共同出现的关键词可以有效地反映文本关键词之间的关联强度,减少了关键词的空间,用一套结构图有效地展示了关键词之间的关联,所以它常用于横向和纵向分析领域学科的发展过程、特点透视研究领域的研究热点,以及领域或学科之间的关系,反映某个专业的科学研究水平及其发展历史的动态
37、和静态结构,拓展信息检索领域以求帮助用户检索信息等等。目前共词分析的主要可视化方法包括包容图INCLUSIONMAP、临近图PROXIMITYMAP、战略坐标图STRATEGICDIAGRAM等。法国的LAW等运用共词分析法分析环境酸化研究中的政策和科学变化地图;QIN用共词分析法发现学科知识结构;COURTIAL等人用共词分析法分析专利文献的标题词,同时用战略坐标将得出的食品类专利的研究热点问题显示出来。此外,共词分析广泛应用于绘制各个领域的概念图,如用于植物生物学领域(DELOOZE和LEMARIE);用于浓缩物质物理学领域(BHATTACHARYA和BASU);用于化学工程领域(PETE
38、RS和VANRAAN);用于信息检索领域(DINGCHOWDHURY和FOO);用于医学领域(ONYANCHA和OCHOLLA)。国内学者也大量的研究共词分析的应用,如在各知识领域研究热点分析中的应用、在各知识领域研究前沿和趋势的应用等。例如,王琪,胡志刚发表的国际体育科学研究前沿探讨3种体育科学国际著名综合性期刊关键词共词分析根据美国科学情报所提供的SCI和SSCI数据,运用科学计量学中的共词分析方法及可视化软件CITESPACE,绘制出20052009年间3种期刊高频关键词知识图谱。通过对知识图谱的分析,表明现在国际体育科学的研究前沿主要集中的领域13。532多元统计分析与学科评价多元统计
39、分析是对若干可能相关的随机变量的观测值的分析。四川大学公共管理学院的沈建通,姚乐野就是利用了了多元统计因子分析、聚类分析、多维本科生毕业论文(设计)11尺度分析与社会网络分析,在多元统计与社会网络分析法在知识图谱应用的实证研究中以为数据源获取同被引信息,绘制了我国循证医学的知识图谱,可视化地展示我国循证医学的基本框架及其相关的知识领域14。533词频分析与学科评价词频是指能够揭示或表达文献核心内容的关键词或主题词在文章或者讲话中出现的次数。由于一篇文献的关键词或主题词是文章核心内容的浓缩和提炼,在进行学科评价的研究时,如果一个关键词或主题词在这个学科的文献中反复出现,则可反映出该关键词或主题词
40、所代表的研究主题是学科评价研究重点。词频分析法是通过对主题词出现的频率进行分析,利用能够揭示或表达文献核心内容的关键词或主题词在某一研究领域文献中出现的频次高低来确定该领域研究热点、发展动向、研究热点以及这一领域或学科的研究热点的转移趋势。词频分析法是的文献计量方法。词频分析方法被国内外的许多科学计量学研究者应用于学科评价的研究中。例如,荷兰科学计量学家绘制生物化学领域研究前沿的知识图谱,就是通过共引分析与词频分析相结合的方法。侯海燕在文献中利用词频分析法发现,科学知识图谱研究最热衷的研究领域为借助作者共引分析,研究不同学科领域的结构特征,其重点研究的学科领域包括信息科学、社会科学、医学及经济
41、学;梁立明通过词频分析方法研究情报学家对科学的关注视角及解读方法;以及大连理工大学的李江波在基于CSSCI辽宁省管理学研究的计量分析一文中基于词频统计的内容分析法以及科学知识图谱等可视化技术揭示辽宁省以至于我国管理学近期研究热点、前沿和发展趋势15。534社会网络分析与学科评价社会网络分析图谱(SOCIALNETWORKANALYSISMAPPING)是基于社会网络分析的知识图谱。社会网络分析图谱对于学科评价的应用价值,在于可以广泛应用于对学科评价的各种载体与单元的关联分析;借助社会网络分析的中心度指标分析与评价关键节点在网络结构中的地位与作用;从引文网络背后潜藏的隐性文,做出基于文献的发现。
42、54在学科评价中所应用到的科学知识图谱方法实例分析目前,数据库日益完备,学术论文数量渐趋增加,学科评价很难再单靠专家人工进行定性判断。由于文献计量方法则可以提供学科领域组织性、结构性较强的描述数据,弥补定性评价在内容上的局限,知识谱图谱方法就可以很好的解决这一问题。国内外的许多科学计量学研究者在学科评价的研究中常常应用词频分析方法等科学知识图谱方法。科学知识图谱已经是定量的学科评价的一种重要的方法。目前,可视化技术与知识图谱方法的在学科评价应用其主要体现在以下几个方面541学科结构及发展特征评价科学知识图谱绘制是把复杂的科学学科知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,使人
43、们得以了解某个学科或研究领域在科学知识版图上的位置以及构建其知识结构与框架,从而为学科发展及研究者提供方便。例如共现分析方法可以研究对学科的自然科学内部各个学科在交叉互动状态下的布局情况,并绘制学科共现知识图谱。张婷,郑保章,王续琨当代科学传播研究的知识结构和相关知识领域基于科学知识图谱的本科生毕业论文(设计)12尝试性研究对传播学的知识结构进行了探索性分析,用可视化方法勾勒出科学传播研究的基本框架及其相关的知识领域16。另外,屈天鹏的基于SCI的辽宁省高校自然科学学科分布与合作网络知识图谱以国际权威的科学引文索引数据库SCI为数据来源,运用科学知识图谱方法,研究辽宁省19992008年间各高
44、校发表于SCI的自然科学论文17。他以19992008时间段的数据通过文献计量法和引文分析法对辽宁省自然科学研究SCI论文发表概况和国际影响力进行了分析,截取20062008近三年的数据,进行自然科学学科共现图谱与合作网络知识图谱的绘制,进一步研究辽宁省自然科学学科分布以及科学合作现况及研究前沿。542学科内科学实体评价通过绘制科学知识图谱,大致揭示出学科的现状,学者可以直观了解近些年来学科主要研究力量及其所关注的热点问题。例如大连理工大学21世纪发展研究中心的姜春林利用科学计量学的前沿研究方法科学知识图谱,基于CSSCI19982008收录的我国自然辩证法研究领域三大核心期刊数据,借助于改进
45、的BIBEXCEL计量软件,在我国自然辩证法研究科学知识图谱中从作者合作、机构合作、关键词共现、共被引等几个指标分别绘制了科学知识图谱。根据图谱进一步了解到,以山西大学郭贵春等为代表的自然辩证法研究以科学技术、科学哲学和技术哲学为核心话题,以国外经典学术著作为学科研究的文献基础18。543学科的科学生产力评价一门学科的发展离不开优秀科学家的倾力支撑。在学科发展过程中,同样有一批优秀学者推动了它不同分支领域的衍生与发展。一段时期内研究领域相似的学者们形成了该领域当中代表不同分支学科领域的学术群体。我们借助科学知识图谱的可视化技术手段,绘制出学科主流学术群体及其代表人物知识图谱,形象地展示该领域学
46、术群体及其生产力状况。大连交通大学人文社科学院,大连理工大学21世纪发展研究中心杜广强,许振亮为了研究高影响力作者在当代国际技术创新理论前沿热点主流领域,运用信息可视化技术等新兴科学计量学方法,在国际技术创新理论前沿与热点领域主流学术群体与代表人物一文中,对20012005年国际技术创新理论前沿热点领域论文高被引频次前50名作者进行分析,绘制出技术创新理论前沿热点主流学术群体及其代表人物的知识图谱19。根据图谱分析的出TEEDCEDJ、PORTERME、POWELLWW等这些前沿学科与主流群体的代表人物为开创或发展当代技术创新理论主流分支学科作出的突出贡献。大连理工大学21世纪发展研究中心大连
47、理工大学网络一信息一科学一经济计量实验室刘则渊,梁永霞,庞杰试图运用信息可视化技术等新兴科学计量学方法来研究人因工程发展趋势及代表人物。其数据来源是2003年JCR在工业工程领域ENGINEERING,INDUSTRIAL33种期刊中的有关人因工程的三种期刊。它利用美国科学情报研究所的SCI数据库科学引文索引,在国际人因工程主流学术群体及其代表人物一文中对1994年至2006年国际人因工程领域论文高被引频次前50名作者进行分析,绘制出国际人因工程主流学术群体及其代表人物的知识图谱20。此外,大连理工大学科学学与科学技术管理研究所侯海燕,刘则渊,陈悦,姜春林,尹丽春,庞杰当代国际科学学主流学术群
48、体及其代表人物运用信息可视化技术等新兴科学计量学方法,对1995年本科生毕业论文(设计)13至2004年国际科学学领域论文高被引频次前50名作者进行分析,绘制出科学学主流学术群体及其代表人物的知识图谱21。544学科影响力评价我们可以通过运用科学计量学最新的知识图谱方法,重新认识一门学科的基本概念、学科界限、学科结构、学科地位,以及与相关学科的关系,从而了解该学科的影响力。陈悦,刘则渊对现代管理学的学科的影响力进行深入研究。他们通过运用知识图谱方法,以国际管理类学术期刊数据为样本进行研究,阐明了管理学与心理学、社会学、经济学、数学等相关学科的关系。管理学的基本概念与学科地位一种基于科学计量学的
49、再认识一文在回顾国内外管理学学科概念的基础上,通过对知识图谱的分析界定管理学的学科界限及学科地位。他们研究得出,管理学作为独立学科在人类知识体系中地位有上升的趋势,对该学科的影响力正在增强,并对我国管理学学科合理布局提供启示。他们的研究为管理学走向国际学术前沿提供了方向22。545学科发展趋势评价学者通过采用科学知识图谱这一科学计量学领域的新技术,将学科基础理论的核心结构、学科前沿和新生长点以可视化的图像直观地表达出来,形成全新的学科领域的知识图谱,用可视化的图谱形象地展示学科的结构与发展,揭示学学科的动态发展规律。天津师范大学管理学院贺颖,祝庆轩基于科学知识图谱的档案学基础理论进展研究19992008年运用科学知识图谱的方法,针对档案学四大基础理论文件生命周期理论、文件连续体理论、整理理论、价值鉴定理论的热点研究问题进行探讨。从CNKI中国期刊全文数据库中检索出近10年来各基础理论的关键词,并加以统计、分析、绘图,梳理档案学理论发展的脉络,并指明档案学理论未来发展趋势23。另外,还有大连理工大学的李江波基于SCI辽宁省管理学研究的计量分析运用基于词频统计的内容分析法以及科学知识图谱等可视化技术来揭示辽宁省和我国管理学近期研究热点、前沿和发展趋势24。546学科可用资源评价学者可以通过综合运用词频分析、共词分析、社会网络分析、信息可