1、AMLC 与 PSDS 检测医学论文重复率结果分析摘 要:本文选择安徽医学投稿论文作为研究样本,利用中国知网学术不端文献检测系统(AMLC)与万方数据论文相似性检测系统(PSDS)对论文进行检测,比较分析检测结果。通过比较分析检测医学论文重复率的结果发现医学论文重复率较高,AMLC 与 PSDS 检测差异显著,单篇检测结果差异较大。 关键词:论文;医学;重复率;中国知网;万方数据 中图分类号:G213 文献标识码:A 文章编号:1672-8122(2016)05-0069-02 一、引 言 2015 年 3 月 27 日,BioMed Central 撤回了 43 篇“伪造”同行评审的论文,其
2、中 41 篇来自中国,作者单位涉及 30余家国内知名三甲医院,学术造假、论文抄袭瞬间再次成为社会舆论的焦点。急功近利、学术浮躁是我国学术界的固有顽疾,而因为毕业、晋升、竞争的压力,作者进行学术造假、论文抄袭的现象较为普遍。 为了净化学术环境,彻底消除学术造假、论文抄袭,政府在政策方面出台了相关规章制度规范学术研究行为,数据库商等软件行业则从技术上寻求解决,其中论文相似性检测系统就是反抄袭、反剽窃的有效技术之一1。目前,国内应用较广、影响较大的论文检测系统为中国知网学术不端文献检测系统(AMLC)与万方数据论文相似性检测系统(PSDS) ,这些检测系统对医学论文的反抄袭、反剽窃起到了积极的作用,
3、有效地遏制了学术造假与论文抄袭。2010 年, 安徽医学编辑部开始启用 AMLC,对于论文重复率超过 30%的稿件直接退稿。2014 年底, 安徽医学网络投稿平台正式启用,同时一并启用 PSDS。自此, 安徽医学所有稿件必须经过网络投稿平台注册,且必须通过AMLC 与 PSDS 的同时检测,更加严格地控制论文的重复率(不得超过 20%) 。本文利用 AMLC 与 PSDS 对安徽医学登记接收的论文进行论文重复率检测,并对检测结果进行统计分析,现报道如下。 二、研究资料与方法 1.研究样本。选择 2015 年 3 月 15 日至 2015 年 4 月 15日安徽医学网络投稿平台登记接收的论文作为
4、研究样本。排除作者、单位等信息不全的论文;如有任一重复率检测系统(万方、知网)无法检测的论文,则排除该论文。2.分析方法。将符合要求的研究样本,分别上传至AMLC、PSDS 进行检测,对 AMLC 与 PSDS 的检测结果进行定量与定性分析,并进行统计学比较分析。 3.分析指标。选择论文重复率作为本文定量分析指标,即 AMLC 文字复制比和 PSDS 论文相似比。参照 安徽医学处理稿件经验,将论文重复率20%作为正常稿件,论文重复率20%作为抄袭嫌疑稿件。 4.统计学处理。应用 SPSS 15.0 软件对本文数据进行统计分析,定量分析指标以均数标准差( )表示,比较分析采用 t 检验,定性分析
5、指标以例(百分比)表示,比较分析采用 2 检验,以 P0.05) 。如表 1 所示。 三、讨论与建议 1.医学论文重复率较高。通过 AMLC 与 PSDS 的共同检测,发现医学论文的重复率处于较高水平。AMLC 的重复率为(16.61 17.05) %,论文重复率20%的稿件占31.88%;PSDS 的重复率为(10.7715.69)% ,论文重复率20%的稿件占 15.16%。王福军等2对第三军医大学学报遵义医学院学报来稿文字复制比进行统计分析,AMLC检测论文重复率20%的稿件占 20.3%,PSDS 检测论文重复率20%的稿件占 15.7%,与本文分析结果相似。中国知网对已发布的期刊文献
6、进行学术不端文献检测,发现大量存在文字重合率超过 30%的文章。不可否认,论文抄袭、一稿多投、重复发表等导致了医学论文重复率的高水平。一方面是我国科研人员普遍对学术不端行为认识不足,抵制学术不端的意识不强,导致学术不端行为频繁发生;特别是剽窃抄袭他人研究成果、数据造假、论文重复发表,直接导致了论文的高重复率。另一方面,不合理的学术评价、学术体制的误导和法律规范的缺少,导致了论文抄袭等学术不端行为的发生3。 2.AMLC 与 PSDS 检测差异显著,单篇差异较大。通过统计分析本研究的检测结果,发现 AMLC 与 PSDS 检测的论文重复率存在统计学差异,AMLC 检测的论文重复率明显高于PSDS
7、;且 AMLC 检测结果中,论文重复率 20%的稿件比例显著高于 PSDS,差异亦有统计学意义。另外,统计结果显示单篇论文 AMLC 与 PSDS 的检测结果差异较大。例如:稿件编号为 2015-688 的论文,AMLC 检测论文重复率为42.70%,PSDS 检测论文重复率仅为 7.70%,相差达35.00%;稿件编号为 2015-656 的论文,AMLC 检测论文重复率为 48.10%,PSDS 检测论文重复率为 82.80%,相差达34.70%。对于学术论文而言,产生以上差异的主要原因为检测资源库的时间跨度差异、对比范围差异与对比期刊差异。AMLC 资源库的期刊回溯到 1915 年,而
8、PSDS 资源库的期刊仅回溯到 1985 年,时间跨度的差异直接导致两者资源数量的巨大差异(AMLC 期刊论文 3000 万篇,PSDS 期刊论文 2000 万篇)1。AMLC 对比范围包括中国学术期刊网络出版总库、中国博士硕士学位论文全文数据库、中国重要会议论文全文数据库、中国重要报纸全文数据库、中国专利全文数据库、互联网资源、部分英文数据库、港澳台学术文献库、优先出版文献库等,而 PSDS 对比范围包括中国学术期刊数据库、中国学位论文全文数据库、中国学术会议论文数据库和 中国学术网页数据库等4,由此产生的差异显而易见。另外,中国知网、万方数据近年开始与多种学术期刊签订了独家收录协议,使得
9、AMLC 与 PSDS 的资源数量出现了差异。中国知网收录的文献类型多样,学科覆盖范围广,独家收录期刊种类越来越多;然而万方数据独家收录中华医学会下属的“中华系列” “中国系列” “国际系列”高质量期刊,这一优势使得万方数据在医学学科出类拔萃5。 3. 建议。 (1)统一检测标准。无论是AMLC,还是 PSDS,他们都有各自的核心检测技术与对比范围,缺乏统一的标准,导致检测结果的巨大差异。因此,建议加强学术不端检测系统建设,尽快统一国内的检测标准,如:统一对比范围,互相开放独家收录期刊的文献资源,统一增加图书、图片与外文文献资源,统一扩展检测文献的常用格式等;(2)作者严于律己。急功近利、学术
10、浮躁是造成我国学术不端行为的根源,而作者自身缺少学术道德,对学术不端行为认识不足,对论文抄袭的危害估计不足,是造成医学论文高重复率的直接原因。因此,医学论文的作者应严于律己,加强对学术不端的认识,主动拒绝论文抄袭,成为执行道德原则和道德规范的学术行为主体6,这是预防医学论文抄袭的重要基础;(3)编者严格把关。医学期刊的编辑与审稿专家应严格把关,客观、公正、科学的评价论文,这是预防医学论文抄袭的关键。审稿专家在对医学论文创新性和内容进行科学评价的同时,需加强对论文研究方法和数据的审阅,重点审查一稿多投、抄袭、篡改数据等不端行为3。期刊编辑对作者的投稿应进行多次重复率检测,投稿时必须进行首次检测,
11、修回论文需进行再次检测,刊用论文在正式发表前仍需检测,以避免作者一稿多投或重复发表。编辑在多次检测过程中,应使用多个数据库,首次检测采用一个数据库(如 AMLC) ,复测时采用两个或多个数据库(PSDS 等)联合检测,尤其是医学期刊,多个数据库联合复测可以检索出独家收录的文献7;(4)读者积极监督。谢燕等8认为学术成果的检验不是一次性完成的,期刊编辑、专家审阅仅仅是论文发表的入门审查,重要的是发表后在社会上接受实践检验。读者是学术期刊重要的服务对象,因此有必要将读者纳入医学论文的预防体系之中,加强医学论文抄袭的防范。医学期刊应鼓励读者积极参与学术不端监督,注意收集读者对发表论文的反映,重点关注
12、已发表论文是否存在抄袭、一稿多投、重复发表等行为。 捏造数据、篡改数据和剽窃等学术不端行为严重败坏了学术风气,阻碍了学术进步,违背了科学精神和道德,抛弃了科学的真实诚信原则。学术不端行为的蔓延是不折不扣的负能量传播,给科学事业的发展带来了严重的负面影响。处在信息爆炸时代的科技期刊,其主要功能是站在对学术求新、对读者负责的社会视 角,对内容庞杂、数量巨大的作者来稿进行甄别和筛选,剔除垃圾信息,创造出更新更美的科学文化精品9。总之,学术期刊应积极承担起抵制学术不端行为的重任,编审人员不仅要善于利用现代技术手段进行审查、评价论文,同时要加强学术不端行为预防机制的建设,完善学术规范与学术道德教育,为读
13、者、作者营造健康的学术环境。 参考文献: 1 李志明.知网、万方、维普论文相似性检测系统比较研究J.大学图书情报学刊,2015(1). 2 王福军,冷怀明,谭修荣.AMLC 与 PSDS 检测结果的比较研究J.中国科技期刊研究,2014(9). 3 吴林娟.学术期刊出版机构对学术不端行为的控制J.图书与情报,2011(6). 4 徐仲.两种学术不端检测系统的差异性及问题讨论J.图书馆理论与实践,2014(8). 5 张宁.职称评审中学术不端文献检测系统之比较研究J.图书馆工作研究,2014(11). 6 史书侠.学术不端文献的计量分析J.中华医学图书情报杂志,2012(2). 7 曾玲,徐川平,吴开明.重庆医学拟刊用稿件二次查重结果分析J.重庆医学,2013(29). 8 谢燕,钱俊龙,潘小伦等.从防范学术不端论文中提升编辑职业素养J.中国科技期刊研究,2011(4). 9 陈锐锋.防治学术病,促使科技期刊健康发展J.科技与出版,2013(8). 责任编辑:东方绪