1、(2011届)本科毕业论文(设计)开题报告题目20042009国内信息检索研究论文的引文分析专业信息管理与信息系统班级学号姓名指导教师一、选题的背景、意义1引文分析的历史背景引文分析的产生可以追溯至引文索引思想的产生和发展。引文索引引文分析的工具是给定的文献集合中所有参考文献的一个结构化的目录。1955年,谢巴尔德索引的副主编WC阿德尔在美国文献学杂志上发表了一篇文章,提出了谢氏索引的原理可以用于别的领域,当然包括科学文献领域。该文原是按加菲尔德的建议写成的,他当时是文献学杂志的副主编。就在这一年,他也发表了题为科学引文索引的论文。第一期科学引文索引SCI予1961年问世,这是文献计量学史上的
2、一个重要的里程碑。其数据内容包括了1959年1960年出版的著作。由于它包括了生物医学和技术在内的自然科学整个领域,所以称为SCI系统。SCI系统于1963年开始定期出版,其主题谱系逐年扩大,从1973年起,SCI系统除自然科学、技术、农业、生物医学等领域之外,又开始广泛搜集社会科学出版物,从1978年起,又吸收了艺术和人文科学的文献。SCL的初始目标本来是提供从引文的角度查找原始文献的工具,但由于引用数据之间的特殊联系,使其功能不断延伸、扩展,形成了一个独特的领域引文分析。在SCI创制之前也曾有过零碎而分散的引文分析,据记载,1927年格罗斯GROSS等人进行了文献学史上第一次引文分析。他们
3、统计了化学专业的某些期刊论文的参考文献并进行了分析,得出了化学教育方面的核心期刊。以后便不断有引文分析方面的研究发表,但由于基本数据难以取得,局限性较大,结论可信度小。1965年,著名的科学家和科学史家普赖斯DJPRICE在引文索引基础上,进一步发展了引文分析方法。SCI使过去零散的引文分析进入了系统化和规模化,在此基础上又提出了许多基本概念、评价指标,创造了许多新的分析方法,使分析过程不断规范化。理论与实践相结合,逐渐发展成为一整套特有的理论方法体系。2国内外研究现状有关引文分析的研究,国内外许许多多的人都对此表现出了很大的兴趣,相对而言国外的研究比国内的要新颖、多元化。如DAVENPORT
4、CRONIN2000)将引文看作代表信赖的原型。他们认为在虚拟环境中,引文实际上代表了一种信赖。当A引用B的文章时,A认为B的观点是支持性的,而B引用的内容是被协商许可了的,引用内容的同时也就影响B的思维。因此,引文网络系统可以被看成是信赖系统,引文索引则可以被看成是一个推荐系统推荐被引次数多的文章。FANGROUSSEAU2001将引文系统看成是网格,这些菱形网格对应的文献耦合与共引文献就是网格系统的基本结构。杰尔等人提出了引文分析一种相似性计量方法引用图,它是基于连通性原理,在共被引和文献耦合上没有相联系的文章通过图链接的扩展得到引用文献之间的联系的测量指标。SMALL2004解释了引文理
5、论与MERTON关于科学人际关系网络理论的相互关系,他将引文看成是对知识债务的一种象征性偿还。MEISTECMEISTERM(2001),CHENHICKS(2004),BRANTLEFALLAH2007等人认为研究专利引文网络,可以分析出其中知识流动和技术扩散的路径。NERUR(2005),LEYDESDORFF(2007等人在期刊引文网络中分析了个别期刊的局部的相对影响力。当然,随着计算机的发展和网络的应用,国内外学者可以通过更多的途径对引文分析研究进行相互借鉴和相互参考。因此,国内学者对于引文的研究也进入了一个全新的研究领域。他们充分利用自己能挖掘和吸收的国内外引文资料,从而突破原有的引
6、文分析研究思维模式,使自己的研究登上一个新的台阶。不过,不能否认的是,对于引文网络的结构研究,如挖掘其中的核心文章,或是网络解构,以及研究拓扑结构的动态变化及进化,国内研究仍相对较少,研究主题也比较分散,比较值得一提的是,柳泉波和许骏2008),马楠和官建成(2008),以及黄亚明等人(2008)都引入了GOOGLE的PAGERANK算法,分别从不同角度对引文网络进行了研究。3信息检索研究论文的引文分析的意义(1)信息检索研究论文的引文分析可以反映其信息检索研究论文的学术价值;学术界认为,研究成果的学术价值不仅表现为其相关论著能否在著名刊物上发表,而且表现为该论著被引用和应用的情况。因此评价信
7、息检索有关研究成果是否先进,是否实用,既要看发表其研究论著的刊物知名度或影响力,也要看其被引用和应用的频度。一般说来,论文发表的刊物级别越高,其学术水平越高,因为著名刊物都有较严格的审稿程序和资深的审稿专家,能够获得发表的论著必有相当的水平,但如发表后无人引用,那也如空中楼阁,而了解引用情况的手段就是引文分析,论文被引用的高频率,说明其水平获得公认,应用价值较高。因此,通过对信息检索研究论文的引文分析,我们不仅可以看到信息检索研究论文的一个定量成果,如载文量,引文次数,还可以看到它所反映出的先进性,公认性,从而给该引文的价值做一个更准确的定位。(2)信息检索论文的引文分析可以对信息检索研究论文
8、进行查新咨询相互补充引文分析作为一种情报学手段,可以弥补查新咨询质量监控较难、文献资源滞后等弊端。所谓查新咨询,是指针对某一特定课题,通过文献检索,回顾一定时间(5年,10年,甚至15年)内有关的文献信息,并进行分析对比、综合评价、对科研课题的先进性和新颖性作出评估,为科研开题立项或鉴定评奖提供科学依据。由于查新咨询受文献资源、检索手段、查新人员水平等诸多因素的影响,质量参差不齐,而且往往疏忽对近期期刊信息的查询(因为新刊出版至编入检索工具的时间较长),并偏重于主题词途径,不能反映某些作者的研究进展与学术价值。如果说,查新咨询能够证明某项研究是“前无古人”,即在该研究之前没有人涉猎该领域,因而
9、是领先超前的,而引文分析则能够证明该项研究是否“后无来者”,即该研究之后是否被推广应用。一项研究论著或成果发表后如无人参考引用,其理论或实践价值,先进性和科学性,也可想而知了。现在一些研究成果评审中,把查新咨询报告与引文分析作为硬指标,有些评审条件规定要求有35年内推广应用或引用证明与评价,可见评审专家已注意到这个问题。从某种意义上说,引文分析资料对科研成果的先进性评价和应用价值的评判更有客观性和公正性。(3)信息检索研究论文的引文分析可以系统反映信息检索研究进展引文分析的基础是检索某作者或某论文的引用情况。通过作者索引途径,可以查出该作者所发表的一系列文献及其被引用情况,同时也查到了与该作者
10、研究课题相关的文献;通过主题索引途径,可以查出该主题有哪些人研究,该课题有哪些相关文献。由于被信息检索引用文献是经过引用者精心挑选并阅读的,对于信息检索研究来说更有代表性,更能系统地反映这一领域的进展情况。正如我们有时从综述后所附的参考文献去追溯原文一样,往往可以得到更有价值的信息。二、研究的基本内容与拟解决的主要问题1研究的基本内容(1)对引文分析的工作原理及应用情况的介绍引文分析,就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量的一种分析,对于引文分析原理介绍,我们一般
11、从引文分析工具引文索引着手。而现在我们将通过网络调查、文献分析,了解引文分析的工作原理,并指出所使用的基本参数及含义和应用状况。(2)介绍和分析引文分析的来源数据库、数量、范围等内容。我们使用的引文数据库是CSSCI,我们已在前面做了介绍,但在论文中我们也会做一些相关的补充例如,我们应用了CSSCI他的中文专题数据集收集和数据相应的预处理功能,以便对重复数据、遗漏数据、数据格式转换以得到干净的待加工的数据集等等。另外,我们还将了解和知道需要进行引文分析的20042009信息检索论文数量、范围等相关信息。(3)专项分析(详细分析)专项分析,我们在这里首先对软件分析工具BIBEXCEL使用情况进行
12、了描述,并对这个软件的使用对所得到的结果进行分析。我们利用这个特定的软件及分析技术对我们20042009信息检索论文中提取的专题数据集中的引文进行各种方位的分析,如语种、数量、核心文献的分析,并利用内容分析法,对其中核心文献进行点评。(4)总结前文,并提出了当代引文发展的几点建议。20042009年信息检索研究论文分析,是一个针对信息检索科学领域进行的分析,有一般的引文分析的优点和足,也有其特有的优点和不足,我们将在这里做个总结,并提出了当代引文分析的几点建议。2拟解决的主要问题(1)研究当代信息检索研究论文引文分析的独特性及其一些固有的缺陷;(2)研究信息检索研究论文的引文分析发展方向和趋势
13、。三、研究的方法与技术路线、研究难点,预期达到的目标1研究的方法与技术路线选用CSSCI,中文社会科学引文索引(CHINESESOCIALSCIENCESCITATIONINDEX)作为引文数据库。CSSCI是一个遵循文献计量学规律,采取定量与定性相结合的方法从全国2700余种中文人文社会科学学术性期刊中精选出期刊作为来源期刊的引文数据库。我们通过CSSCI检索有关在20042009年发表所有信息检索研究论文和引文。利用BIBEXCEL这个文献分析软件,对在20042009年有关信息检索研究论文进行引文分析,具体步骤如下(1)选择来源数据文献(2)BIBEXCEL或者文本编辑器中打开的原始数据
14、文件要有特定的格式。(3)开始分析,转换到DIALOG格式,BIBEXCEL可以处理的格式。(4)简单抽取字段(5)基本分析和引文分析,不仅可以实现对语种、年代、数量、类型、核心引文等的计量分析,也可以实现对文献共现和网络,引文耦合等的分析。2研究难点BIBEXCEL这个文献分析软件是以前从没有接触过的软件,而且目前只有英文版的。我们首先遇到的难点就是软件的应用。专题数据集的收集及格式转换和专题数据包的引文分析也是一大难点,对于专题数据包的收集,我们需要理解和应用数据源的收集、清理相关技术,把与信息检索研究论文不相关的资料清理出去,而专题数据包的引文分析则包括语种、数量等诸多因的分析素,由于2
15、0042009的有关论文的数量的庞大,这一过程也将十分麻烦。3预期达到的目标通过对引文分析工作原理、应用情况的调查研究,对20042009年国内信息检索的研究论文的引文进行收集,并进行基于语种、年代、数量、类型、核心引文等的计量分析,以研究引文随年代的变化规律,对其中重要引文进行内容分析,分析信息检索研究论文的发展方向和趋势。另外,也将通过这些分析提出几点有关信息检索引文分析的建议。四、论文详细工作进度和安排201011222011110阅读有关引文分析工作原理、研究情况、应用情况的参考文献;通过各种渠道了解引文分析的主要评价指标、各参数的含义及意义;完成文献综述,完成外文翻译。拟定研究方法、
16、研究步骤,深入学习引文分析的重要软件工具,为数据分析做初步准备;完成开题报告。2011022120110311根据研究主题,确定数据集,对数据集进行数据清理工作,并利用特定的软件及分析技术对专题数据集中的引文进行多方位的分析探索。完成论文初稿。2011031220110503毕业实习,完善论文,就论文初稿与指导教师商议,并按指导意见进行认真、反复修改。2011050420110512毕业论文定稿,上交指导老师。2011051320110610论文交指导老师审阅、评阅老师评阅。准备答辩材料。五、参考文献1廖金波论引文分析的由来与发展J高校图书馆工作1999,19324262骆柳宁自引分析J情报杂
17、志2005,24111251273肖明,李国俊,袁浩基于引文耦合的数字图书馆研究结构可视化分析J图书馆学理论研究2010,54751554JOHNMBUDD,LAURENMAGNUSONHIGHEREDUCATIONLITERATUREREVISITEDCITATIONPATTERNSEXAMINEDJSCHOOLOFINFORMATIONSCIENCEANDLEARNINGTECHNOLOGIES2010,512943045SMALLONTHESHOULDERSOFROBERTMERTONTOWARDSANORMATIVETHEORYOFCITATIONJSCIENTOMETRICS2004
18、,60171796郑尚标对引文分析认识和再思考J中小学图书情报世界2010,430457WANGHONGLU,JJANSSEN,MILIOS,NJAPKOWICZ,YONGZHENGZHANGNODESIMILARITYINTHECITATIONGRAPHJKNOWLEDGEANDINFORMATIONSYSTEMS2006,1111051298柳泉波,许骏基于链接分析的科学文献个性化排序算法J中山大学学报自然科学版2008,47687929张庆云试论引文分析的意义与方法J淮海医药2001,19325625710梁永霞,杨中楷,刘则渊引文分析学的学科地位J情报理论和实践2010,3351920