2004-2009国内信息检索研究论文的引文分析[文献综述].doc

上传人:文初 文档编号:45391 上传时间:2018-05-14 格式:DOC 页数:8 大小:79KB
下载 相关 举报
2004-2009国内信息检索研究论文的引文分析[文献综述].doc_第1页
第1页 / 共8页
2004-2009国内信息检索研究论文的引文分析[文献综述].doc_第2页
第2页 / 共8页
2004-2009国内信息检索研究论文的引文分析[文献综述].doc_第3页
第3页 / 共8页
2004-2009国内信息检索研究论文的引文分析[文献综述].doc_第4页
第4页 / 共8页
2004-2009国内信息检索研究论文的引文分析[文献综述].doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

1、(2011届)毕业论文(设计)文献综述题目20042009国内信息检索研究论文的引文分析专业信息管理与信息系统班级学号姓名指导教师一、前言部分学术论文的主创内容与引用的参考文献的观点、文字、数据等引文内容构成一篇学术论文的有机整体【1】。对被引用的参考文献而言,被引用是一种带评价性的学术传播,其被引次数、引用期刊等是构成该被引文章、被引学术期刊学术评价的重要计量统计资料。近年来,随着“文献积累增长”、“学术意识强化”、“信息收集力提高”,学术论文引用参考文献篇均引用量大幅增长。另外,在收录的期刊数据库中,论文所列参考文献越多,被他人点击机率越高,也是数据库网络时代传播动因的必然趋势。而引文分析

2、是利用各种数学、统计学以及逻辑方法,对科技期刊、论文、著作等各种分析对象的引用或被引用现象进行分析研究,以便揭示其数量特征和内在规律,达到评价、预测科学发展趋势的目的。随着引文数量的积累,引文分析的的重要性也日益凸显出来,其中,利用引文分析理论的指导来建立引文索引,已经有相当丰硕的成果,如科学引文索引(SCI)即是全世界最具权威性的引文数据库,收录了世界各国超过6000种最重要科技期刊的引文状况【2】。而在国内,比较权威的就是中文社会科学引文索引(CHINESESOCIALSCIENCESCITATIONINDEX)。中文社会科学引文索引是由南京大学中国社会科学研究评价中心开发研制的引文数据库

3、,用来检索中文人文社会科学领域的论文收录和被引用情况。CSSCI遵循文献计量学规律,采取定量与定性评价相结合的方法从全国中文人文社会科学学术性期刊中选出学术性强、编辑规范的期刊作为来源期刊。现已开发有CSSCI(19982006年)9年数据,来源文献近63万余篇,引文文献409余万篇。近年来,随着网络技术的发展和计算机的普及,通过网络查找所需要信息越来越受到大家的关注,随之而来的有关信息检索研究的论文也受到了学者们的青睐,就2009一年在国内权威机构上发表的有关信息检索研究论文就不计其数,这还不包括在其他杂志、书籍等发表的文章【3】。发表的论文数量已如此之多,随带的他们的参考文献数量更是数目庞

4、大,因此,对信息检索的论文的引文分析有一定的必要。科学引文索引可以从他们的相互印证的关系上,揭示信息检索研究论文之间的内在联系,并通过科学引文索引数据库的检索和查询,揭示已知理论和知识的应用、提高、发展和修正的过程,从一个重要侧面揭示信息检索研究与发展的基本走向,并通过科学引文索引数据库的统计与分析,可以从定量的视角评价地区、机构、信息检索研究这一学科以及相关学者的科学研究水平,为信息检索研究和人文社会科学事业发展提供第一手资料。二、主题部分1引文分析的产生与发展引文分析的产生可以追溯至引文索引思想的产生和发展。引文索引引文分析的工具是给定的文献集合中所有参考文献的一个结构化的目录。1955年

5、,谢巴尔德索引的副主编WC阿德尔在美国文献学杂志上发表了一篇文章,提出了谢氏索引的原理可以用于别的领域,当然包括科学文献领域【4】。该文原是按加菲尔德的建议写成的,他当时是文献学杂志的副主编。就在这一年,他也发表了题为科学引文索引的论文。第一期科学引文索引SCI予1961年问世,这是文献计量学史上的一个重要的里程碑。其数据内容包括了1959年1960年出版的著作。由于它包括了生物医学和技术在内的自然科学整个领域,所以称为SCI系统。SCI系统于1963年开始定期出版,其主题谱系逐年扩大,从1973年起,SCI系统除自然科学、技术、农业、生物医学等领域之外,又开始广泛搜集社会科学出版物,从197

6、8年起,又吸收了艺术和人文科学的文献。SCL的初始目标本来是提供从引文的角度查找原始文献的工具,但由于引用数据之间的特殊联系,使其功能不断延伸、扩展,形成了一个独特的领域引文分析。在SCI创制之前也曾有过零碎而分散的引文分析,据记载,1927年格罗斯GROSS等人进行了文献学史上第一次引文分析。他们统计了化学专业的某些期刊论文的参考文献并进行了分析,得出了化学教育方面的核心期刊。以后便不断有引文分析方面的研究发表,但由于基本数据难以取得,局限性较大,结论可信度小。1965年,著名的科学家和科学史家普赖斯DJPRICE在引文索引基础上,进一步发展了引文分析方法。SCI使过去零散的引文分析进入了系

7、统化和规模化,在此基础上又提出了许多基本概念、评价指标,创造了许多新的分析方法,使分析过程不断规范化。理论与实践相结合,逐渐发展成为一整套特有的理论方法体系。2引文分析的测度指标一般来说,对科学期刊进行分析时常用的测度指标有这么几种即自引率与被自引率、影响因子、即时指标。在对专业和学科结构进行研究时,还可用引文耦合、共被引和H指数等测度指标。1自引率与被自引率在引用文献的过程中,限于主体本身范围内的引用称之为“自引”。包括同一类学科文献的自引、同一期刊文献的自引、同著者文献的自引、同一机构文献的自引、同一种文献的自引、同一时期文献的自引、同一地区文献的自引。自引率就是对主体本身范围内文献引用的

8、次数与主体引用的文献总数的比值。而被自引率则是计算被引用现象的一个测度指标,被自引率就是主体文献被自引的次数与主体被引用的总次数的比值。它反映出被引用中有多少是被自己引用的【5】。目前在国外研究最多的是关于期刊的自引和自引率。一般认为,期刊高自引有助于提升其影响因子;也有研究人员研究去除期刊自引数对影响因子的影响,认为未去除影响因子的数据可以采用;还有研究显示期刊自引与自引率与影响因的负相关性。2影响因子影响因子(IMPACTFACTOR,IF是美国ISI(科学信息研究所)的JCR期刊引证报告)中的一项数据。即某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数,这

9、是一个国际上通行的期刊评价指标。许多著名学术期刊会在其网站上注明期刊的影响因子,以表明在对应学科的影响力。如,美国化学会志、ONCOGENE中国大陆各大高校(如清华大学、哈尔滨工业大学、浙江大学)都以学术期刊的影响因子作为评判研究生毕业的主要标准【6】。3即时指标这是测度期刊被引用速度的指标,它是期刊某年发表的论文当年被引用的次数除以该期刊这一年所发表文章的总数,是衡量期刊重要性的一种依据。4引文耦合当两篇文章同时引用一篇或多篇相同的文献时,这种现象称引文耦合引文耦合的文献之间总存在着这样或那样的联系其联系的程度称为耦合强度。引文耦合分析BIBLIOGRAPHICCOUPLING是文献计量学的

10、重要方法之一,也是构建某个研究领域的研究结构即研究子领域,有时也称为研究前沿或者研究热点中常用方法。如果两篇文献的参考文献中相同的引文数越多或者它们被一起引用的次数越多,则它们的相似性就越高【7】。因此,根据这种相似性对文献进行聚类,在某种程度上可以揭示出某一研究领域的研究结构。5共被引当两篇(多篇论文同时被别的论文引用时,则称这两篇论文具有“共被引”关系。引用它们的论文的多少,即共被引程度,称为共被引强度。自1973年被提出以来,共引分析已成为引文分析里面一种潜在多产的分析方法【8】,它用到许多科学计量学和统计学基本知识,包括矩阵、相似性测度等,不仅可以用来揭示科学结构的发展现状乃至变化情况

11、,还可以用来进行前沿分析、领域分析、科研评价等,进而为宏观科技决策提供先行支持,为科技规划与评估提供基础。随着测度指标的广泛应用,引文之间的联系越来越多的被我们所了解和利用,并为我们揭示各种各样的分析、评价,进而为宏观科技决策提供支持,但是指标之间也存在者某种缺陷,这里我们举个例子来说明如果两篇论文可能在共被引和文献耦合上一点关系都没有,但是,他们之间可以仍就有一个很强烈的联系。因此仅仅使用这两个指标测度时,会给我们带来错误的信息。为此,杰尔等人提出了的引文分析另一种的一个相似性计量方法引用图,它是基于连通性原理来判断论文之间关联性的引文分析测度指标【9】。例如,在下图中,论文A引用了论文C,

12、论文B引用了论文D,显然A和B相互之间没有关系。但是,如果我们把引用图扩展一点点我们可以找到论文C和论文D通过书目耦合链接,关联性很强。而且我们可以推断出引用C的A和引用B的D论文之间的关系。引用图,这一概念的提出具有非常重大的意义,它让我们了解了很多隐藏着的联系,使引文分析的结果更加准确、客观。6H指数HIRSCH(2005)提出H指数来评价研究人员学术成就的时候,恐怕并未料想到所能引发的轰动效应。H代表高引用次数(HIGHCITATIONS)【10】。一个人的H指数是指他至多有H篇论文分别被引用了至少H次。例如,HIRSCH本人的H指数是49,这表示他已发表的论文中,每篇被引用了至少49次

13、的论文总共有49篇。从时间上讲,作为一种指标,面世只有5年多的时间,比较新颖,但是从其短短的发展历程来看,我们不得不承认其发展和膨胀的速度是如此之快,以至于在不知不觉中一些商业数据库推出了基于H指数的指标。把H指数作为一种引文分析指标来推荐,主要原因是考虑到其相对于传统引文分析方法的创新性贡献,其创新性贡献在于,把人们垢弊多年的论文数量、被引频次用一种独特的方式展现,既保留了它们的本质特征,又在这些特征的基础上提出了不一样的体系。这一种体系是否能够比较准确地反映一个人的学术成就并没有定论,但是从对顶尖科学家的分析结果来看,确实具有一定的价值。3对信息检索研究论文分析现状1信息检索研究论文分析的

14、一般研究方法首先,目前大多数有关学者和研究人员对信息检索研究论文的分析都是采用通过数据论文C论文D论文A论文B库检索系统获取最大的样本量。这种方法是与引文分析法是有本质区别的,这种方法主要借助CNNKI、万方、维普等大型数据库检索系统,检索出题名中包含“信息检索”或“情报检索”的所有论文,然后分别以我国图书情报学领域有代表性的核心期刊的刊名作为关键词,对结果进行二次检索,检索相关论文。而引文分析主要是对引用和被引用现象的一种分析,它主要通过在专门的引文数据库如CSSCI查找有关信息检索研究的论文,利用科技文献的引证与其被引证现象进行研究,并使用图论、模糊集合、数理统计等数学方法和逻辑思维方法,

15、揭示文献所蕴含的情报特征和相关关系。2信息检索论文分析主要集中在定量分析这一方面近年来,我国信息检索有关领域的学者和研究者主要集中于对信息检索研究论文的定量分析,定量分析是对社会现象的数量特征、数量关系与数量变化的分析。信息检索研究论文的定量分析主要集中在对时间分布、期刊分布、地区分布、作者、研究内容和基金资助等各个方面进行统计分析,确定该研究的核心期刊、核心机构,并进而对各种分析的结果做出一个探讨。而引文分析还可以利用特定的软件及分析技术对专题数据集中的引文进行各种方位的分析,如语种、数量、核心文献的分析,并利用内容分析法,对其中核心文献进行点评。4信息检索研究论文的引文分析的意义1信息检索

16、研究论文的引文分析可以反映其信息检索研究论文的学术价值;学术界认为,研究成果的学术价值不仅表现为其相关论著能否在著名刊物上发表,而且表现为该论著被引用和应用的情况。因此评价信息检索有关研究成果是否先进,是否实用,既要看发表其研究论著的刊物知名度或影响力,也要看其被引用和应用的频度。一般说来,论文发表的刊物级别越高,其学术水平越高,因为著名刊物都有较严格的审稿程序和资深的审稿专家,能够获得发表的论著必有相当的水平,但如发表后无人引用,那也如空中楼阁,而了解引用情况的手段就是引文分析,论文被引用的高频率,说明其水平获得公认,应用价值较高。因此,通过对信息检索研究论文的引文分析,我们不仅可以看到信息

17、检索研究论文的一个定量成果,如载文量,引文次数,还可以看到它所反映出的先进性,公认性,从而给该引文的价值做一个更准确的定位。2信息检索论文的引文分析可以对信息检索研究论文进行查新咨询相互补充引文分析作为一种情报学手段,可以弥补查新咨询质量监控较难、文献资源滞后等弊端。所谓查新咨询,是指针对某一特定课题,通过文献检索,回顾一定时间(5年,10年,甚至15年)内有关的文献信息,并进行分析对比、综合评价、对科研课题的先进性和新颖性作出评估,为科研开题立项或鉴定评奖提供科学依据。由于查新咨询受文献资源、检索手段、查新人员水平等诸多因素的影响,质量参差不齐,而且往往疏忽对近期期刊信息的查询(因为新刊出版

18、至编入检索工具的时间较长),并偏重于主题词途径,不能反映某些作者的研究进展与学术价值。如果说,查新咨询能够证明某项研究是“前无古人”,即在该研究之前没有人涉猎该领域,因而是领先超前的,而引文分析则能够证明该项研究是否“后无来者”,即该研究之后是否被推广应用。一项研究论著或成果发表后如无人参考引用,其理论或实践价值,先进性和科学性,也可想而知了。现在一些研究成果评审中,把查新咨询报告与引文分析作为硬指标,有些评审条件规定要求有35年内推广应用或引用证明与评价,可见评审专家已注意到这个问题。从某种意义上说,引文分析资料对科研成果的先进性评价和应用价值的评判更有客观性和公正性。3信息检索研究论文的引

19、文分析可以系统反映信息检索研究进展引文分析的基础是检索某作者或某论文的引用情况通过作者索引途径,可以查出该作者所发表的一系列文献及其被引用情况,同时也查到了与该作者研究课题相关的文献;通过主题索引途径,可以查出该主题有哪些人研究,该课题有哪些相关文献。由于被信息检索引用文献是经过引用者精心挑选并阅读的,对于信息检索研究来说更有代表性,更能系统地反映这一领域的进展情况。正如我们有时从综述后所附的参考文献去追溯原文一样,往往可以得到更有价值的信息【11】。三、总结部分对引文这一现象的解释,国外有许多看法,DAVENPORTCRONIN(2000)将引文看作代表信赖的原型【12】。他们认为在虚拟环境

20、中,引文实际上代表了一种信赖。当A引用B的文章时,A认为B的观点是支持性的,而B引用的内容是被协商许可了的,引用内容的同时也就影响了B的思维。FANGROUSSEAU2001将引文系统看成是网格,这些菱形网格对应的文献耦合与共引文献就是网格系统的基本结构【13】。MEISTERCMEISTERM(2001),CHENHICKS(2004),BRANTLEFALLAH2007等人认为研究引文网络,可以分析出其中知识流动和技术扩散的路径【14】。相对而言,国内研究较少,研究主题也比较分散。但是,随着我国学者对引文这一现象的逐渐了解和深入研究,他们对引文分析学这一领域的研究也表现出了极大的兴趣。信息

21、检索研究论文的引文分析,是引文分析学加诸于特定对象,它通过与知识计量学,文献计量学等相关的方法,对信息检索研究论文进行数量、机构、语种、内容等等进行统计分析,通过各方面的对比,可以使我们认识到信息检索研究论文的现状、发展、优势及缺陷,了解具体走向,为研究有关论文的学者提供一种依据和借鉴。因此对信息检索研究论文的引文分析十分的必要【15】。四、参考文献1戴作芳,龚如义学术论文引文的“必要性“与“适度性“探究J四川教育学院学报2009,25863662苑彬成,方曙,刘清,张晋辉国内外引文分析研究进展综述J情报科学2010,28(1)1471773JOHNMBUDD,LAURENMAGNUSONHI

22、GHEREDUCATIONLITERATUREREVISITEDCITATIONPATTERNSEXAMINEDJSCHOOLOFINFORMATIONSCIENCEANDLEARNINGTECHNOLOGIES2010,512943044廖金波论引文分析的由来与发展J高校图书馆工作1999,19324265骆柳宁自引分析J情报杂志2005,24111251276郑尚标对引文分析认识和再思考J中小学图书情报世界2010,430457肖明,李国俊,袁浩基于引文耦合的数字图书馆研究结构可视化分析J图书馆学理论研究2010,54751558邱均平,马瑞敏,李晔君关于共被引分析方法的再认识和再思考J情

23、报学报2008,27151609WANGHONGLU,JJANSSEN,MILIOS,NJAPKOWICZ,YONGZHENGZHANGNODESIMILARITYINTHECITATIONGRAPHJKNOWLEDGEANDINFORMATIONSYSTEMS2006,11110512910HIRSCHANINDEXTOQUANTIFYANINDIVIDUALSSCIENTIFICRESEARCHOUTPUTJPROCEEDINGSOFTHENATIONALACADEMYOFSCIENCESOFTHEUNITEDSTATESOFAMERICA2005,10246165691657211张庆云

24、试论引文分析的意义与方法J淮海医药2001,19325625712DAVENPORT,CRONINTHECITATIONNETWORKASAPROTOTYPEFORREPRESENTINGTRUSTINVIRTUALENVIRONMENTSJFESTSCHRIFTINHONOROFEUGENEMETFORD2000,151753413ROUSSEAULATTICESINCITATIONNETWORKSANINVESTIGATIONINTOTHESTRUCTUREOFCITATIONGRAPHJSCIENTOMETRICS2001,50227328714MEISTERC,MEISTERMTRENDSANDTRAJECTORIESINMEMSRELATETECHNOLOGIESANANALYSISONTHEBASISOFPATENTAPPLICATIONDATAEB/OL20091216HTTP/IEEEXPLOREIEEEORG/STAMP/STAMPJSPTPARNUMBER1558743ISNUMBER3312315梁永霞,杨中楷,刘则渊引文分析学的学科地位J情报理论和实践2010,3351920

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 文献综述

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。