切换为使用验证码登录
科研生涯最痛苦的事情除了做实验、处理数据、码字外,就属论文查重。论文查重自从被提出以来,在防止一稿多投、抄袭、伪造、篡改、重复发表等学术不端行为起到非常重大的作用。但在今天来看,不可将论文查重作为衡量论文创新性的唯一标准。
一、论文查重的发展历程
国内论文查重较国外比起步晚,目前国内常用的查重检测系统主要有5类,分别是:知网、万方、维普、PaperPass、大雅,认可度最高且使用范围最广的是知网查重系统。论文查重发展至今,已近被广泛应用于毕业论文、科研、期刊投稿、图书专著等领域。
(1)汤兴华等于2005年探讨了建立学术期刊论文学术不端检测数据库的必要性和可行性。(2)2008年4月,武汉大学信息管理学院出版科学系沈阳教授团队推出文档相似性检测工具一ROST反剽窃系统(早期版本名称为“网盗克星”)
(2)2008年12月底,《中国学术期刊(光盘版)》电子杂志社与同方知网(北京)技术有限公司历时2年研发的“科技期刊学术不端文献检测系统”问世,成为国内最具代表性的学术不端检测系统。
(3)2010年3月,国内第二大数据集成商万方数据推出了万方论文相似性检测系统。
(4)2010年9月, 维普推出通达论文引用检测系统。
(5)2022年6月12日中国知网宣布向个人用户提供学术不端检测服务。
二、论文查重的局限性
对以查重率判断文章创新性的方法,国内学者早已对此有所察觉。很简单的例子就是一篇文章论文重复率在40%,以目前国内期刊普遍接受的查重率25%来看,显然是不符合要求的。但深入探讨发现,这类文章的重复率主要集中在实验步骤、权威性定义等方面,是否具有学术价值应另行讨论。
1、检测系统的差别
不同的检测系统对同一篇文章的检测结果是不相同的。检测系统简单理解就是将上传的文章与检测系统收录的数据库进行比对,采用的检测系统、收录的数据库各个检测平台都不相同。由此,检测结果也有差别。
2、检测系统过于机械化
看似检测采用了许多新技术,实则比较机械。论文查重率是指论文文字的重复比,重复比的衡量标准很简单,就是将文章的字词、句子一一与数据库的资源进行对比,相同则为重复,最后以数字呈现。很多作者通过变化语序、增加文章总字数等方式降重,但又不改变句子原意。这就导致文章冗长,不利于提高编辑初审效率,也限制了文章的创新。
3、检索结果定量化
论文重复率是以百分比形式呈现,是量化的表现。论文是学术成果的载体,发表论文是为了学术交流,从而促进学术共同体的发展。量化的重复率不能体现文章的创新性,需附以编辑审核,进行定性分析,方能确定文章的创新性如何。