WithdrarXiv数据库上线,揭示预印本撤稿起因
本报讯 研讨职员克日推出了一个WithdrarXiv数据库,内容涵盖预印本平台arXiv从1991年上线以来撤回的1.4万多篇论文。WithdrarXiv经由过程大批数据,供给了对于这些撤稿的新看法。相干研讨克日颁布于arXiv。开辟该数据库的美国宾夕法尼亚年夜学盘算机学家Delip Rao表现,除了提醒这些预印本论文被arXiv删除的起因外,WithdrarXiv数据库旨在增进主动化东西的开辟,从而辅助研讨职员在提交论文时标志潜伏的过错。现在,年夜少数预印本论文都不经由偕行评断或正式的品质保障流程。在这项研讨中,Rao跟共事依据作者供给的撤稿来由,对撤回的预印本论文停止了分类。他们发明,现实过错、方式过错或其余主要过错是最罕见的撤稿起因——6000多篇论文因而被预印本平台删除。别的,有3100多篇论文由于内容不完全或有更多任务正在停止中而被撤回,2800多篇论文则由于被其余出书物收录而撤回。研讨指出,这与学术期刊宣布的很多撤稿申明构成了赫然对照,后者平日产生在经偕行评断的论文宣布后,起因与抄袭或数据造假等学术不端行动或其余过错有关。“在预印本平台颁布论文的初志是成为首发者,而论文自身纷歧定是完整准确的。这可能是预印本论文比经偕行评断的论文更有可能因现实或方式过错被撤回的起因。”克罗地亚萨格勒布年夜学人体剖解学研讨职员Vedran Katavic说,“论文中的方式过错平日能够经由过程偕行评断被铲除。偕行评断越严厉,因严重的现实或方式过错被撤稿的可能性就越小。”美国伊利诺伊年夜学厄巴纳-喷鼻槟分校的信息学家Jodi Schneider也对撤稿停止过研讨。她忠告称,不要把预印本平台撤稿与学术期刊撤稿一概而论,二者存在明显差别。比方,多少乎全部的arXiv撤稿都是由作者发动的,而学术期刊的撤稿决议平日由出书商作出,偶然乃至未经作者批准。只管如斯,Schneider以为,WithdrarXiv对信息迷信家来说还是一个风趣的数据宝库。假如研讨职员在预印本阶段就可能发明研讨中的潜伏过错,可能有助于增加终极版本中的成绩。“人们会从这些数据中找到风趣的货色,使之更轻易处置、治理跟应用。”(赵宇彤)相干论文信息:https://arxiv.org/abs/2412.03775