1、本科毕业设计论文届论文题目20042009年国内信息检索研究论文的引文分析所在学院专业班级信息管理与信息系统学生姓名学号指导教师职称完成日期年月日诚信声明我申明,所呈交的论文设计是本人在老师指导下进行的研究工作及取得的研究成果。据我查证,除了文中特别加以标注和致谢的地方外,论文设计中不包含其他人已经发表或撰写过的研究成果,也不包含为获得或其他教育机构的学位或证书而使用过的材料。我承诺,论文设计中的所有内容均真实、可信。论文设计作者签名签名日期年月日授权声明学校有权保留送交论文(设计)的原件,允许论文(设计)被查阅和借阅,学校可以公布论文(设计)的全部或部分内容,可以影印、缩印或其他复制手段保存
2、论文(设计),学校必须严格按照授权对论文设计进行处理,不得超越授权对论文(设计)进行任意处置。论文设计作者签名签名日期年月日20042009年国内信息检索研究论文的引文分析摘要引文分析是利用各种数学及统计学的知识对论文的引文进行比较、归纳、抽象、概括等的逻辑方法。信息检索研究论文的引文分析,是指对信息检索研究领域的论文的引文进行分析。本文通过对信息检索研究领域20042009年的有关论文及引文数据进行收集和整理,从得出的结果中对来源文献进行主题、作者隶属机构、核心期刊的分析。至此,结合来源文献的年代变化规律,来判断引文的情况。另外,我们将进行基于引用数量、年代、核心期刊等的引文分析,了解引文随
3、年代的变化规律,分析它们对学科发展的影响力。通过这些分析,我们归纳总结出我国对信息检索这一领域研究的优势和自身存在的缺陷,并提出可能改变这些缺陷的意见和建议。关键词引文分析信息检索研究论文THECITATIONANALYSISTODOMESTICINFORMATIONRETRIEVALRESEARCHPAPERSIN20042009ABSTRACTCITATIONANALYSISISAWAYWHICHUSETHEKNOWLEDGEOFMATHEMATICSANDSTATISTICSTOCOMPARE,ABSTRACTANDGENERALIZEDATASTHECITATIONANALYSISTO
4、INFORMATIONRETRIEVALRESEARCHPAPER,THATISTHEANALYSISTOTHEINFORMATIONRETRIEVALRESEARCHFIELD,WECOLLECTANDCOLLATETHEDATASANDTHEQUOTATIONSOFRELEVANTPAPERSININFORMATIONRETRIEVALFIELDIN20042009,ANDANALYSISTHESEDATASTOGETRESULTSWECANANLYSISTHERESULTSABOUTTHETOPICRESULTSOFPAPERS,THEAUTHORAFFILIATION,ANDTHECO
5、REJOURNALSTOCOMBINEWITHTIMECHANGINGSITUATIONS,WECANGETMORERESULTSABOUTCITATIONSINADDITION,WEWILLANALYSISTHECITATIONBASEDONQUANTITIES,TIMEANDCORECITATIONJOURNALSTOUNDERSTANDTHEVARIATIONOFAGEWITHCITATIONSWEWILLSUMMARIZEDSOMEADVANTAGESANDTHEDEFECTSITSELFWEALSOWILLGIVESOMEADVICETOCHANGETHEDEFECTSKEYWORD
6、SCITATIONANALYSISINFORMATIONRETRIEVALRESEARCHPAPERS本科生毕业论文(设计)1目录1绪论111项目背景简介1111引文分析历史背景1112信息检索研究论文的发展趋势1113信息检索研究论文引文分析的意义212国内外研究分析现状3121对信息检索研究论文分析现状3122国内外发展状况413项目目标42引文分析的工具和一般方法621数据来源622数据的收集与整理6221数据收集6222数据的清理623文献计量工具BIBEXCEL73信息检索论文的来源文献分析931信息检索论文的论文主题分析932论文的作者隶属机构分析1233所属期刊分析144信息检索
7、论文引文分析1741引文量分析1742文献被引情况统计分析19421引文来源分析21422引文语种分析2143核心引用期刊2244引文年代分析225课题评价256总结和建议26致谢27参考文献28本科生毕业论文(设计)11绪论11项目背景简介111引文分析历史背景引文分析的产生可以追溯至引文索引思想的产生和发展。引文索引是给定的文献集合中所有参考文献的结构化的目录。1955年,谢巴尔德索引的副主编阿德尔在美国文献学杂志上发表了关于引文索引的文章,提出谢氏索引的原理也可以用于其他的领域,尤其是科学文献领域。该文一开始是按当时文献学杂志的副主编加菲尔德的建议写成的。当年,加菲尔德也发表了论文科学引
8、文索引。第一期科学引文索引SCI在1961年问世,这对于文献计量学史来说,有着重要的里程碑的意义。科学引文索引中数据内容基本包括了19591960年这两年出版的著作,并且包括了生物医学和技术在内的自然科学整个领域,我们把这个索引称为SCI系统。SCI系统在1963年开始定期出版,它的主题谱系也逐年扩大,并且从1973年起,SCI系统又在自然科学、技术、农业、生物医学等学科领域的基础上,开始广泛搜集社会科学类出版物,而从1978年起,又吸收了艺术和人文科学及其相关领域的文献。SCL的目标由本来的作为提供从引文的角度查找原始文献的工具,变成由于引用数据之间的特殊联系而不断延伸、扩展而形成独特的领域
9、引文分析。当然,在SCI创制之前,就已经有了零碎而分散的引文分析,据记载,1927年格罗斯等人进行了第一次的引文分析。他们统计了化学专业这一领域的某些期刊论文的参考文献并进行了分析,得出了有关“化学教育”方面的核心期刊。随后又不断有引文分析方面的研究成果得到发表,但是由于基本数据的难以取得,局限性较大,所以结论可信度仍然还是小的。1965年,著名的科学家和科学史家普赖斯在引文索引这一基础上,又进一步发展了引文分析方法引文分析法。SCI让过去零散的引文分析进入到了系统化和规模化的阶段,并在此基础上提出了许多的基本概念和评价指标,创造了许多新的分析方法,使引文分析过程不断规范。引文分析理论与实践的
10、结合,更使引文分析逐渐发展成为一整套特有的理论方法体系1。112信息检索研究论文的发展趋势学术论文的主创内容与引用的参考文献的观点、文字、数据等引文内容构成一篇学术论文的有机整体2。对被引用的参考文献而言,被引用是一种带评价性的学术传播,其被引次数、引用期刊等是构成该被引文章、被引学术期刊学术评价的重要计量统计资料。近年来,随着“文献积累增长”、“学术意识强化”、“信息收集力提高”,学术论文引用参考文献篇均引用量大幅增长。另外,在收录的期刊数据库中,论文所列参考文献越多,被他人点击机率越高,也是数据库网络时代传播动因的必然趋势。而引文分析是利用各种数学、统计学以及逻辑方法,对科技期刊、论文、著
11、作等各种对象的引用或被引用现象进行分析研究,以便揭示其数量特征和内在规律,达到评价、预测科学发展趋势的目的。随着引文数量的积累,引文分析的的重要性也日益凸显出来,其中,利用引文分析理论的指导来建立引文索引,已经有相当丰硕的成果,如科学引文索引(SCI)即是全世界最具权威性的引文数据库,收录了世界各国超过6000种最重要科技期刊的本科生毕业论文(设计)2引文状况3。而在国内,比较权威的并是中文社会科学引文索引(CSSCI)。中文社会科学引文索引是南京大学中国社会科学研究评价中心开发和研制的一个引文数据库,是用来检索关于中文人文社会科学领域的论文收录情况和引用被引用情况。CSSCI这一引文索引遵循
12、文献计量学规律,结合定性和定量评价,在全国中文人文社会科学学术性期刊中选出那些学术性很强、编辑规范(著录格式规范)的期刊作为我们的来源期刊。现在开发有CSSCI数据,来源文献就已近63万余篇,引文文献更是高达409余万篇。近年来,随着网络技术的发展和计算机的普及,通过网络查找所需要信息越来越受到大家的关注,随之而来的有关信息检索研究的论文也受到了学者们的青睐,就2007一年在国内权威机构上发表的有关信息检索研究论文就不计其数,这还不包括在其他杂志、书籍等发表的文章。发表的论文数量已如此之多,随带的他们的参考文献数量更是数目庞大。因此,信息检索的论文的引文分析有一定的必要。科学引文索引可以从他们
13、的相互引证的关系上,揭示信息检索研究论文之间的内在联系,并通过科学引文索引数据库的检索和查询,揭示已知理论和知识的应用、提高、发展和修正的过程,从一个重要侧面揭示信息检索研究与发展的基本走向,并通过科学引文索引数据库的统计与分析,可以从定量的视角评价地区、机构对信息检索研究这一学科发展状况以及相关学者的科学研究水平,为信息检索研究和人文社会科学事业发展提供第一手资料。113信息检索研究论文引文分析的意义信息检索论文的引文分析,是对信息检索这一学科的引文文献进行的分析,他对了解信息检索论文的理论研究水平和发展状况等有着非常重要的意义。(1)信息检索研究论文的引文分析可以反映其信息检索研究论文的学
14、术价值学术界认为,研究成果的学术价值不仅表现为其相关论著能否在著名刊物上发表,而且表现在研究成果的被引用状况如何上。因此,我们判断信息检索有关研究成果价值几何,就要看发表的研究论著的期刊的影响力或知名度和该论著被引用和应用的频度。大体说来,论文发表的刊物的级别越高,其学术价值越高,因为著名刊物都有较严格的审稿程序和资深的审稿专家,能够获得发表的论著必有具有相当的水平,但是如果研究成果发表后无人引用,那也如诉诸高阁,而我们对于研究成果学术价值的判断就是引文分析,论文被引用的频率越高,说明学术价值越受到认可,应用价值也就较高。因此,通过对信息检索研究论文的引文分析,我们不仅可以看到信息检索研究论文
15、的一个定量成果,如载文量,引文次数,还可以看到信息检索研究论著的先进性,学术价值的公认性,从而对信息检索研究论文的价值做一个更准确的定位。(2)信息检索论文的引文分析可以对信息检索论文提供一定的查新与补充本科生毕业论文(设计)3引文分析视作一种情报学手段,通过对信息检索研究论文引文分析,可以弥补信息检索领域研究成果的查新咨询问题,而对于论文监控论文质量、改进文献资源滞后的问题也有一定的帮助。查新咨询,我们在这里针对的信息检索这一领域的研究成果,通过对文献检索,回顾一定时间(几年或十几年)内所有与此领域有关的文献信息,并进行分析比较、评价、并评估信息检索研究成果的先进性和新颖性,从而为科研课题的
16、立项或课题鉴定提供科学依据。查新咨询能够了解,在该研究之前是否有人涉猎该领域与该课题的情况,因而具有预见性。引文分析则是证明该研究是否在之后得到推广。一项研究论著或成果发表后若没有被参考引用,其理论或实践价值也就可想而知了。我们对信息检索研究论文的评审中,可以把引文分析和与之相关的评审报告作为硬性指标,判断35年内研究论著的推广应用或被引用情况。这对科研成果的先进性应用价值的评判具有重大的意义。(3)信息检索研究论文的引文分析可以反映该领域的研究进展情况引文分析的基础是检索某作者或某研究成果的被引用情况。通过索引作者,查到该作者所发表有关文献及其这些文献的被引用情况,同时也可以查到与该作者研究
17、课题相关的文献;正如我们所使用的万方数据库里,当我们索引到我们所需要的论文及其作者信息,我们也可以看到许多主题类似的其他论文及其作者信息。主题索引可以帮助我们查出该主题相关作者,该课题相关文献。并且,我们可以看到信息检索论文引用文献基本都是经过引用者选择的,正如我们所说的取其精华一样,这些引用文献对信息检索领域的研究代表性更强,而对信息检索这一研究领域的进展情况也能更明确反映。我们经常也从综述后所附的参考文献去信息查询原文,从而得到更有价值的信息4。12国内外研究分析现状121对信息检索研究论文分析现状1信息检索研究论文分析的一般研究方法首先,目前大多数有关学者和研究人员对信息检索研究论文的分
18、析都是采用通过数据库检索系统获取最大的样本量。这种方法是与引文分析法是有本质区别的,这种方法主要借助CNNKI、万方、维普等大型数据库检索系统,检索出题名中包含“信息检索”或“情报检索”的所有论文,然后分别以我国图书情报学领域有代表性的核心期刊的刊名作为关键词,对结果进行二次检索,检索相关论文。而引文分析主要是对引用和被引用现象的一种分析,它主要通过在专门的引文数据库如CSSCI查找有关信息检索研究的论文,利用科技文献的引证与其被引证现象进行研究,并使用图论、模糊集合、数理统计等数学方法和逻辑思维方法,揭示文献所蕴含的情报特征和相关关系。本科生毕业论文(设计)42信息检索论文研究特点近年来,我
19、国信息检索有关领域的学者和研究者主要集中于对信息检索研究论文的定量分析,定量分析是对社会现象的数量特征、数量关系与数量变化的分析。信息检索研究论文的定量分析主要集中在对时间分布、期刊分布、地区分布、作者、研究内容和基金资助等各个方面进行统计分析,确定该研究的核心期刊、核心机构,并进而对各种分析的结果做出一个探讨。而引文分析还可以利用特定的软件及分析技术对专题数据集中的引文进行各种方位的分析,如语种、数量、核心文献的分析,并利用内容分析法,对其中核心文献进行点评。122国内外发展状况有关引文分析的研究,国内外许许多多的人都对此表现出了很大的兴趣,相对而言国外的研究比国内的要新颖、多元化。如DAV
20、ENPORT李雪萍|DT论文|FX|SO情报杂志|IN东华理工学院|IA东华理工学院图书馆,344000/东华理工学院图书馆,344000|RE361000361000|SC图书馆、情报与文献学|AU冯凯|CLG35|PY2006|DE神经网络信息检索多媒体教学质量评价|CD王旭,2000,QK胡守仁,1993,QK孙修东,2003,河南机电高等专科学校学报王晓明,2005,现代情报|本科生毕业论文(设计)8ER|(2)开始分析数据,我们在得到上述格式的数据之后,我们进行如下操作MISC/CONVERTTODIALOG/CONVERTFROMWEBOFSCIENCE,这是数据转存的一个环节,即
21、把TXT文本的数据转存为DOC格式的文档。我们主要就是通过这个FILEDOC对论文和引文进行分析。(3)开始分析,简单地先抽取字段,比如我们需要得到来源文献的作者信息,我们可以在OLDTAG输入CD(标识符字段,表示参考文献信息),在SELECTFIELDTOBEANALYSED,VIEWFILETOGETINTOABOUTWHICHFIELDSAREAVAILABLE中选择ANY;SEPARATEDFIELD栏目,就会在THELIST中出现关于参考文献的信息了如图21所示图21BIBEXCEL界面信息(4)同理,我也可以进行其他标识符字段的分析,比如来源文献作者、期刊、年代等。本科生毕业论文
22、(设计)93信息检索论文的来源文献分析31信息检索论文的论文主题分析论文关键词是用于表达文献主题内容的词语。论文是科学研究中创造性思想的载体,它的首要任务在于传递科研信息,同时也具有文化储存和文化积累的意义。无论是从传递信息角度,还是储存信息角度考虑,主题词或关键词的标引都将与科技论文的其他论文的主题有莫大的关系。以下是20042009的信息检索论文的关键词信息,而相对应的数字则是关键词在论文中出现的次数。首先我们把20042009年所有的来源文献进行汇总,然后分析关键词出现的频次,我们可以看到如下数据(这里列出的是出现频次最高的关键词前20),我们把这20个关键词所组成的数据做成一个样本来分
23、析信息检索研究论文的主题内容。如表31所示表31关键词频次信息表论文中的关键词出现的频次信息检索525搜索引擎58本体48网络信息检索47数字图书馆32跨语言信息检索24信息检索课23向量空间模型20检索模型17信息检索系统16信息组织16查询扩展16网络信息14相关性14元搜索引擎14本体论13情报学13信息服务12语义网12智能信息检索11从表中我们可以看到20042009年我们论文分析的主题主要在各种信息检索(网络信息检索、跨语言信息检索、智能信息检索)、搜索引擎(元搜索引擎)、本体和本体论、向量空间模型等主题上。由于信息检索这个关键字是一个非常大而泛的词,对我们主题的研究没有产生很大的
24、影响,本科生毕业论文(设计)10因此先忽略她高达525的频次的作用。这张表还可以看到近6年对信息检索论文的研究仍以理论研究占主导地位,有关论文关键词中,搜索引擎出现的频率达58次,占所有次数的13,另外若把元搜索引擎算入在内的话,出现频次达所有频次的16。本体和本体论的研究也占着非常重要的位置,出现的频次达总频次的14。,此外如网络信息检索的研究,数字图书馆等也占有一定的比例。在这里,我们还可以看到信息检索课的关键词出现的频次也多达23次,表明关于信息检索教学与教育的文章也较多,说明人们重视信息检索理论的学习和素质的培养。目前在本科和研究生相关专业的教学中,例如信息管理与信息系统专业,都将信息
25、检索作为一门比较有用的课程,注重信息检索课与传统文献信息检索结合在一起,通过理论和实践的教学,提高学生信息检索的能力和信息素养。本科生毕业论文(设计)11表3220042009年关键词频次信息表200420052006200720082009信息检索123信息检索112信息检索82信息检索83信息检索74信息检索51搜索引擎15搜索引擎24本体论11本体论13本体论12信息检索系统7网络信息检索7网络信息检索15搜索引擎9搜索引擎7相关性6跨语言信息检索7数字图书馆7数字图书馆10信息检索课8查询拓展6网络信息检索5网络7网络信息7本体论6ONTOLOGY7数字图书馆5查询拓展5查询拓展3检索
26、语言6网络信息资源6网络信息检索6网络信息检索5关联规则4本体论3检索方法5元搜索引擎6跨语言信息检索6检索模型4跨语言检索系统4科学文献资源2信息组织5向量空间模型6检索模型5信息查询4数字图书馆4可视化2本体论5自然语言处理5数字图书馆5信息检索课4情报学4本体2信息检索课5信息组织5教学改革4数据库4信息服务3信息组织2元数据5数据库4向量空间模型4语义网3语义网3向量空间模型2元搜索引擎4跨语言信息检索4智能信息检索3信息检索系统3智能信息检索3相关性2信息服务4检索模型4知识检索3XML3信息检索课3网络信息检索2刚才我们已经进行了信息检索研究论文主题的总的分析,指出了2004200
27、9年所有的来源文本科生毕业论文(设计)12献中的关键词出现的频次,并通过对频次的分析,了解了这六年信息检索研究论文的研究大体主题和内容。现在我们进行二元分析,通过对20042009年某一关键词出现次数的变化规律,来了解信息检索主题的发展动向。表32是20042009年每年排在最前的关键词信息,我们对其进行压缩(以搜索引擎和元搜索引擎为例)得到表33所示表33搜索引擎和元搜索引擎在20042009年出现的频次统计表20042005200620072008200919309700图31关键词频次随时间变化图通过图31我们可以发现,对搜索引擎这一主题的研究呈现先上升后下降的趋势变化,在2004年的时
28、候研究的频次已有了一定的数量,到了2005年达到最高点出现频次达30次之高,随后对搜索引擎的研究又迅猛下降,甚至到了2008年和2009年已基本趋向于0。这可能与搜索引擎的技术的迅猛发展并逐渐壮大有关,现如今,网络搜索引擎的技术和搜索能力已经达到了涵盖了我们所需的方方面面,达到了至高点。他的继续壮大可能就是个性化、定制化的信息服务,通过对用户的需求进行了解,搜索引擎提供针对特定用户与个人的需求信息。32论文的作者隶属机构分析论文的作者与论文的隶属机构休戚相关,通常我们了解一篇论文的隶属机构,并于此了解有关的信息。本科生毕业论文(设计)13表34论文隶属机构频次表(20042009年)20042
29、0052006200720082009武汉大学13南京大学13武汉大学9武汉大学10南京大学6武汉大学5北京大学10武汉大学10南京大学7南京大学8中国科学院国家科技图书馆6中国科技技术信息研究所4南开大学9中山大学5北京大学6中国科学技术研究所6中山大学5解放军南京政治学院4南京大学9上海交通大学6黑龙江大学3南开大学4中国科技技术信息研究所5中国科学院国家科学图书馆3中山大学7中国科学院文献情报中心4大连理工大学3中山大学3北京大学5南京航空航天大学3北京师范大学6南开大学4南京理工大学3浙江工商职业技术学院3武汉大学4北京大学3吉林大学3北京大学4天津商学院3华中师范大学3兰州交通大学3
30、中山大学3中国人民大学3北京师范大学4华中师范大学2北京大学2聊城大学3河南科技学院2解放军南京政治学院3中国国防科技信息中心3北京师范大学2中国科学院文献文献情报中心2南开大学2南京大学2在20042009年发表的有关信息检索论文中。绝大多数论文都来自科研能力较强的高校,而公共图书馆的参与率相对较低。从CSSCI中提取的作者隶属机构发文排名数据表明,信息检索研究论文有固定的高校群,而且而高校所在地域分布广泛,说明信息检索论文的研究具有全国性,影响广泛。但分布不均,武汉大学和南京大学时两个对信息检索研究论文数量特别突出的高校,在20042009年的信息检索研究论文中,武汉大学和南京大学有关研究
31、数量基本靠在最前面。并本科生毕业论文(设计)14对高校有着一定积极的影响,活跃了高校师生的学术气氛。33所属期刊分析表35论文所属期刊频次表(20042009年)2004167篇2005148篇2006114篇2007113篇200899篇200973篇情报杂志28情报杂志28情报理论与实践18现代图书情报技术19情报杂志18情报理论与实践13情报科学27现代图书情报技术18情报杂志18情报杂志16情报理论与实践15情报杂志12情报理论与实践24图书馆杂志16情报科学12情报理论与实践13情报科学8图书情报工作9现代图书馆情报技术22情报理论与实践15现代图书馆情报技术11图书情报工作12图书
32、情报工作8情报科学7图书情报工作12图书情报工作13图书情报工作10情报学报11现代图书馆情报技术7情报学报5情报学报10情报科学13情报学报9情报科学8图书馆建设7现代图书馆情报技术4图书馆论坛9图书馆论坛9图书馆理论与实践6图书馆杂志6图书馆学研究5图书馆论坛3中国信息导报5情报学报8图书馆论坛6图书馆理论与实践5图书与情报4图书馆学研究3情报资料工作4中国信息导报7图书馆杂志5图书情报知识4图书情报知识4图书情报知识3中国图书馆学报4中国图书馆学报5图书馆工作与研究5情报资料工作4情报学报4图书馆建设3大学图书馆学报4图书馆理论与实践4中国图书馆学报3图书馆工作与研究4图书馆杂志4中国图
33、书馆学报2本科生毕业论文(设计)15其他18其他12其他11其他11其他15其他9科学论文的分布是一个很复杂的问题,从上表中可以看出2004年至2009年信息检索论文的空间分布规律体现了集中与分散的规律。我们以2009年为例进行纵向研究如表36所示表362009年论文所属期刊频次表来源名称数量比率情报理论与实践13019情报杂志12016图书情报工作9012情报科学7010情报学报5007现代图书情报技术4005图书馆论坛3004图书馆学研究3004图书情报知识3004图书馆建设3004中国图书馆学报2003其他9012数量19161210754444312情报理论与实践情报杂志图书情报工作情
34、报科学情报学报现代图书情报技术图书馆论坛图书馆学研究图书情报知识图书馆建设中国图书馆学报其他图322009年论文所属期刊频率分布图从表36和图32中,我们可以看到57的2009研究论文集中在情报理论与实践、情报杂志、图书情报工作和情报科学上,12的研究论文却在许许多多的期刊上。这正是和布拉德福的文献空间分布规律相符合。对期刊的统计分析,统计分析期刊论文发表的次数,可以揭示刊物在学科研究中的地位和作用,在一定程度上反映出刊物的学术影响力,是评价其学术性和社会效益的客本科生毕业论文(设计)16观标准之一。本科生毕业论文(设计)174信息检索论文引文分析由于2004、2005以及2009年的有关引用
35、文献和参考文献的缺失,在这里将进行的是20062008年有关数据的引文分析。41引文量分析引文量是一个数量指标,它是指某一研究成果所拥有的被引文献的数量,是引文分析中一个非常重要的指标。它是研究文献被利用广度的重要指标。引文量大小,从某种意义上反映了论文作者对相关领域文献情报了解的程度和吸收的能力。一般情况下,引文量越大,说明作者对文献信息的吸收能力越强。表4120042009年信息检索论文数和引文数统计表年度论文总数引文总数篇均引文数2004167200514820061149708512007113100188620089910011011200973从表41中可以看出,所统计200620
36、08年的326篇信息检索研究论文中,有引文2972条,20062008年间期刊的篇均引文数为分别为851,886,和1011条,说明我国信息检索研究人员在吸收利用文献信息的意识和能力逐渐增强,并且,其掌握的相关文献量多,利用程度高,研究空间较为宽阔。本科生毕业论文(设计)18图4120042009年论文发表数量变化图从该图(图41)中可以看出随着时间的变化,有关信息检索研究论文的研究数量逐渐下降。这表明对作者对信息检索领域的研究兴趣正在逐步降低,并转向其他领域。图4220062008年的论文发表数量变化图本科生毕业论文(设计)19图4320062008年引文数量变化图通过上述两幅图(图42和图
37、43)的观察,我们发现,虽然随着年代的增长,信息检索研究论文发表的数量逐渐减少,但所发表的信息检索研究论文的引文数量却得到了一定的提高,这说明学者对引文的使用意识得到了提高,这样更能使作者发散思维,为科学领域的研究提供一份新思路。下图是20062008年发表的论文数和引文数之间的关系图,即上述两幅图的结合体,将不再多做叙述。02004006008001000120020055200620065200720075200820085论文数引文数图4420062008年论文数和引文数的关系图42文献被引情况统计分析引文从某一个程度上可以反映了论文作者对于他人研究成果的阅读和借鉴情况,文献被引情本科生
38、毕业论文(设计)20况的统计分析可以了解文献所在期刊吸收和渗透能力。同时,我们也可以通过被引文献的核心期刊、隶属机构等信息,了解论文质量和对社会造成的影响。引文的被引情况分析是当前文献计量学的热点之一,可以客观反映论文应用情况和学术价值,并为信息编辑人员和研究人员提供非常有价值的信息。下表是对20062008年有关文献被引的计量(列出排名在前的)表4220062008年参考文献引用计量表200620072008李蕾,2000,情报学报5周明建,2004,计算机应用32008,HTTP/WWWSEMANTICSCOKR4HERSH,W,2005,HTTP/TRECNISTGOV4AMERYAHI
39、A,S,2004,PROCOFTHEINTLCONFONMANAGEMENTOFDATAACMSIGMOD3邓志鸿,2002,北京大学学报(自然科学版)3STUDER,R,1998,DATAANDKNOWLEDGEENGINEERING4张联峰,2003,计算机工程与应用3陈晓金,2007,图书馆理论与实践3刘肖静,2004,情报理论与实践4张晓林,2002,情报学报3史忠植,2002,QK3张俊林,2004,计算机科学4王进,2004,中文信息学报32007,HTTP/WWWLOCGOV3郑敏,2003,情报理论与实践3李景,2005,QK3CHEN,MS,1998,IEEETRANSONK
40、NOWLEDGEANDDATAENGINEERING2从表42中可以看出,被引的文献类型多样、语种不一、来源分布广泛。把20062008年的数据合并,得到20062008年有关作者被引信息排名最前的数据如下本科生毕业论文(设计)21表4320062008年引用文献总计量表7邓志鸿,2002,北京大学学报(自然科学版)7李蕾,2000,情报学报7王进,2004,中文信息学报6刘肖静,2004,情报理论与实践6苏新宁,2004,QK6GUARINO,N,1999,IEEEINTELLIGENTSYSTEMS6张晓林,2002,情报学报6STUDER,R,1998,DATAANDKNOWLEDGEE
41、NGINEERING5郑敏,2003,情报理论与实践5INGWERSEN,P,2005,QK5曹树金,2004,情报理论与实践5焦玉英,2003,QK5宋炜,2004,QK4张俊林,2004,计算机科学4AU,2008,HTTP/WWWSEMANTICSCOKR4BERNERSLEE,T,2001,SCIENTIFICAMERICAN4成颖,2004,图书情报工作4史忠植,2002,QK4孙茂松,1999,中文信息学报4HERSH,W,2005,HTTP/TRECNISTGOV4万捷,2003,计算机工程42007,HTTP/WWWLOCGOV421引文来源分析科学研究中引用的文献很广,有期刊
42、论文、图书和特种文献。对被引文献的来源进行分析,将有利于确定文献情报搜集的重点。在上述表43引用频次最高的引文中,可以看到引用的来源主要有两种,一时来源于某种期刊,如情报理论与实践,这中引用占着引用论文的主体。但也有许多的引文是来源于网络,这种论文的类型多种多样可能是某个政府公告,某篇杂志。这一类网络来源引文的多样性使我们的论文内容更加宽阔,思路更加广泛,有助于提高论文质量和其科学价值。422引文语种分析引用文献各种不同的语种构成了引用文献的语种多样性。某一语种的文献被引用量很大,则说明该语种非常普遍。而对于引文语种的分布的考察和分析,对人们有计划地引进外文文献、译文选题、外语教育也有相当重要
43、的意义。通过信息检索论文的引文的语种分析中,我们发现,引本科生毕业论文(设计)22文的语种主要集中在英文和中文上,而且对于信息检索研究论文的研究,我国对英语语种的文献引用量非常大。43核心引用期刊根据英文文献计量学家布拉德福有关文献离散与集中的规律可知,信息检索研究领域大量论文集中在少数期刊上,而学科的少数论文却分散在大量期刊上。这一结果表明研究用量集中的少数期刊很有意义。我对上述20062008被引文献频次最高的文献所在的期刊进行了统计分析,得出如表所示(列出的是前六名期刊的名称)表4420062008核心引用期刊计量期刊名称被引论文数量情报理论与实践16情报学报13北京大学学报7中文信息学
44、报7IEEEINTELLIGENTSYSTEMS6DATAANDKNOWLEDGEENGINEERING6结果表明通过对引用频次最高的论文所在的期刊的再一次压缩分析,可以看到,情报理论与实践和情报学报这两个期刊的权威性最强,是被引频率较高的期刊,按被引次数由高向低排列,可选出信息检索论文的核心引用期刊。当今科技信息浩如烟海,经常阅读核心期刊,就会在最短的时间内获得该学科研究领域的大量信息和最新动态。44引文年代分析一般来说,随着年度的由远而近,引文量呈增长趋势,即时间愈近,被引用的文献愈多。研究引文的年代分析,能够了解文献的最近利用时间,并定量揭示文献老化的规律,还可以从理论上探索文献传播的动
45、态规律,反映期刊作者吸收新信息和新成果的的意识强弱。本科生毕业论文(设计)23表4520062008年论文引用文献数量统计表2006970篇20071001篇20081001篇2006年35篇2007年63篇2008年34篇2005年142篇2006年179篇2007年170篇2004年196篇2005年189篇2006年184篇2003年130篇2004年180篇2005年93篇2002年97篇2003年124篇2004年85篇2001年74篇2002年92篇2003年77篇2000年49篇2001年62篇2002年59篇1999年35篇2000年50篇2001年46篇1998年30篇199
46、9年35篇2000年46篇1997年27篇1998年35篇1999年33篇199620篇1997年31篇1998年33篇我们以2006年的引文年代为例进行分析图452006年论文引用文献数量年代分布图从图45我们可以看到,随着2006年信息检索研究论文引用当年的文献的数量相对较少。但是除近两年的文献外,随着年代的越加久远,所引用的在久远年代的引文的数量就越少。普赖斯指数,即期刊引用文献中近5年内引文占总引文量的百分比,能反映出的期刊引文的新颖性。我们得到20062008信息检索论文引文的普赖斯指数如下所示本科生毕业论文(设计)242006年的普赖斯指数0622007年的普赖斯指数0732008
47、年的普莱斯指数056普赖斯指数是衡量各个知识领域文献老化的数量指标,从2006年2008年的普赖斯指数中我们可以看到,信息检索研究论文的老化速度非常快,我们引用的在5年内的引文量占总引文量的百分比都超过了均值05,而在2007年的时候信息检索研究论文的普赖斯指数达到非常的高度。这表明,2007年对是我国信息检索论文发展特别快速的一年,有关信息检索的科学技术发展规模和程度空前。而在2008年的时候普赖斯指数又下降得非常快,表明,信息检索论文的理论研究差不多已经成型了。本科生毕业论文(设计)255课题评价本课题主要对信息检索研究论文进行了引文分析。首先,我们对引文分析的历史背景、国内外现状和信息检
48、索研究论文的局限做了一个比较笼统的介绍。然后,我们进行了信息检索学科领域论文的一个引文分析,在这个过程中,我们选择了数据来源CSSCI,然后进行数据的收集和整理,并进行了专题数据包的提取和数据净化等工作。从而我们得到了我们所需要的有价值的,有意义的引文分析数据。接着,我们进行了来源数据分析和引文分析。我们首先进行了来源文献的分析如对主题、作者隶属机构和期刊进行了分析,进而对引文的年代、核心期刊、引文量进行了分析。对信息检索这一学科的这一分析,我们也得到了许多的的结论。从这些结论中,我们也看到了信息检索领域文章的发展变化趋势。在此,也对应提出了一些建议。针对这篇论文,我认为,所有的研究人员对事物
49、都有一种偏好,我可能于信息检索这一学科的研究就存在着这种偏好,因此,研究的结果也存在着某些不足。所以,今后我将继续努力,进行更全面,更细致的研究,并且剔除这些偏好的影响,让这一课题的发展更能满足学术性和价值性的要求。本科生毕业论文(设计)266总结和建议引文反映了论文作者对于他人研究成果的借鉴情况,引文分析可以衡量专业期刊对文献的吸收能力,而且对论文的发文质量也有一定的积极意义。被引情况的分析是当前文献计量学的热点之一,尤其在计量研究中发挥着重要作用。引用文献的分析可以客观反映论文的应用价值和期刊的质量,并为科研人员和相关人员提供参考。通过信息检索研究论文的分析,我们基本上了解了信息检索这一研究领域的发展状况,变化趋势。当然,我们在引文分析的过程中也遇到了许多问题,对此,我提出以下建议,以供参考。(1)参考文献及其著录格式应进一步规范。对于信息检索领域论文的核心期刊的分析,我们主要通过参考文献进行分析。因此论文参考文献中的期刊信息的取得就与核心期刊判断有着直接的关系。因此编辑要规范参考文献的著录格式,并排列好参考文献的有关作者、题名、来源期刊等信息,从而便于分析时数据的取得。另一方面,我们要尽量保留文章所有的参考文献,有很多论文的许多内容其实是被引用了的,但在参考文献中却没有列明,这很不利于得到准确的引文分析结果,因此参考文