切换为使用验证码登录
学术不端新花样:批量购买引用,谷歌学术数据遭操控?
在学术界的道德底线上,新的学术不端行为层出不穷。2023年,谷歌学术上突然出现了一位“高产”科学家,他的名字之前从未被听说过,却一跃成为其专业领域被引数最高的学者之一。他被数据库列为其专业领域第36位被引数最高的学者,h-index指数19,这意味着,他至少被引用了19次的论文有19篇。
纽约大学的研究者Yasir Zaki等人最近发表在arXiv上的一项研究揭露了这一场骗局:这位学者及所属机构全是虚构,他所发表的论文由ChatGPT撰写,而那些惊人的引用数也是通过非法手段获得的——部分来自过度自引,更有50个引用是从提供“引文服务”的供应商那里以300美元购买的。
这一事件不仅是对谷歌学术数据库的严重挑战,更是对整个学术界诚信体系的拷问。表明谷歌学术的数据也是可以进行操控的。悉尼大学的癌症研究者Jennifer Byrne担忧:“批量购买引用可能是一个新的发展趋势。”
Zaki的团队在梳理了160多万名研究者的谷歌学术档案后,发现了一系列异常引用的情况。其中,有1016名研究者的论文被引数在一年内增加了10倍,这显然是异常现象。更令人震惊的是,有114名研究者仅凭一篇论文就获得了超过18次的引用,这在正常情况下几乎是不可能的。
为了进一步验证这一现象,Zaki的团队决定亲自进行一场实验。他们让ChatGPT撰写了20篇关于假新闻的论文,并进行了大量自引。然后,将这些文章发表在各种预印本服务器上。不出所料,谷歌学术很快检测到了这些文章,并生成了该虚构研究者的档案。更令人惊讶的是,这些预印本竟被列为了出版物,并提供了380条引用信息。
为了进一步测试购买引用的可行性,研究小组以该虚构研究者的名义联系了一家供应商,购买了“50次引用套餐”。在接下来的40天内,有5篇论文发表,每篇都引用了该虚构研究者的10篇文献。而这些虚构的论文与化学根本无关,显然是为了提高引用次数而刻意为之。
这一行为不仅揭示了学术不端的新花样,也暴露了谷歌学术数据库的漏洞。即使从预印本服务器删除了文章,所贡献的引用次数仍然不变。这无疑给那些企图通过非法手段提高引用次数的研究者提供了可乘之机。
为了识别这种有问题的引用,研究者提出了一个新指标——引用集中指数(c2-index)。这一指标反映了多次引用同一研究者的论文数量。较高的c2-index值提示我们应对该研究者持保留意见。例如,一位研究者的c2-index为45,意味着至少有45篇论文都引用了该研究者的文献45次以上。这显然是一个不正常的现象,值得我们进一步关注和调查。
学术不端行为已经严重破坏了学术界的公信力。批量购买引用作为一种新的不端手段,必须引起我们的高度重视。我们需要加强监管和惩罚力度,同时提高研究者的道德意识和诚信意识。只有这样,我们才能维护学术研究的纯净和公信力。