“幻覺引文”悄然侵蝕公眾對科學(xué)的信任
222
訂閱已訂閱已收藏
收藏點(diǎn)擊播報(bào)本文,約
《自然》雜志一項(xiàng)分析顯示,越來越多科研人員正借助大語言模型輔助文獻(xiàn)檢索、撰寫稿件與編排參考文獻(xiàn)。然而,人工智能(AI)模型卻時(shí)而“無中生有”,捏造查無實(shí)據(jù)的虛構(gòu)條目。據(jù)預(yù)測,自2025年起,或有數(shù)萬篇學(xué)術(shù)出版物混入此類AI生成的無效引文。
有學(xué)者指出,若任由“幻覺引文”滲入學(xué)術(shù)體系,不僅會催生錯誤結(jié)論、干擾后續(xù)研究,甚至可能誤導(dǎo)科研方向。長此以往,將會悄然侵蝕公眾對科學(xué)的信任。
“憑空捏造”愈演愈烈
今年早些時(shí)候,法國圖盧茲大學(xué)計(jì)算機(jī)科學(xué)家紀(jì)堯姆·卡巴納克收到谷歌學(xué)術(shù)通知,稱其文章被《國際牙科雜志》一篇論文引用。他頗感錯愕:自己的研究本系探討如何識破偽造論文,與牙科領(lǐng)域風(fēng)馬牛不相及,且他對那篇被引文章竟毫無印象。他推測,此條引文極可能是AI杜撰出來的幻覺。
這只是冰山一角。多項(xiàng)調(diào)查與研究顯示,隨著大語言模型在文獻(xiàn)檢索、手稿撰寫和參考文獻(xiàn)整理中的普及,AI“憑空捏造”學(xué)術(shù)引文的現(xiàn)象正愈演愈烈。
引文錯誤在學(xué)術(shù)出版界并非新鮮事。美國西北大學(xué)范伯格醫(yī)學(xué)院學(xué)術(shù)倫理與誠信研究專家穆罕默德·侯賽尼表示,在生成式AI問世前,引文錯漏便已存在,如作者姓名拼寫有誤、出版年份或期刊標(biāo)題張冠李戴、數(shù)字對象唯一標(biāo)識符(DOI)缺失錯錄、被引文獻(xiàn)的實(shí)際內(nèi)容與引用者所述細(xì)節(jié)存在出入等。但如今的“幻覺引文”已非單純的信息偏差,而是徹頭徹尾的虛構(gòu),兩者性質(zhì)截然不同。
過去一年間,“幻覺引文”已頻頻現(xiàn)身各類文獻(xiàn)。一項(xiàng)針對三場計(jì)算機(jī)科學(xué)會議近1.8萬篇論文的分析顯示,無法溯源至實(shí)際出版物的參考文獻(xiàn)數(shù)量呈井噴之勢。今年1月公布的數(shù)據(jù)表明,2025年已有2.6%的論文至少包含一條“幻覺引文”,而2024年該比例僅為0.3%。今年2月的另一項(xiàng)研究則估計(jì),在另外四場2025年計(jì)算機(jī)會議上,2%至6%的論文含有無法通過數(shù)據(jù)庫與期刊檔案核驗(yàn)的標(biāo)題或參考文獻(xiàn)。
《自然》雜志新聞團(tuán)隊(duì)與英國Grounded AI公司合作開展的獨(dú)家分析進(jìn)一步證實(shí),2025年至少有數(shù)萬篇期刊論文、專著及會議記錄可能摻雜AI生成的“幻覺引文”。
Grounded AI公司聯(lián)合創(chuàng)始人兼首席產(chǎn)品官尼克·莫利透露,2025年暴露的引文錯誤類型,與大語言模型普及前團(tuán)隊(duì)所見的傳統(tǒng)錯誤大相徑庭。這一變化清晰表明,AI的廣泛使用正是該問題滋生的主因。
對此,美國俄勒岡州立大學(xué)政治學(xué)家艾莉森·約翰斯頓直言,科研人員或?qū)⒚媾R“幻覺引文”泛濫成災(zāi)的亂象。
多措并舉逐一核驗(yàn)
面對來勢洶洶的“幻覺引文”,各類應(yīng)對工具與機(jī)制正應(yīng)運(yùn)而生。
德國柏林自由大學(xué)神經(jīng)科學(xué)博士邁克爾·沃爾希奇,用Python編寫了一款專用腳本,對Crossref數(shù)據(jù)庫中的引文樣本進(jìn)行交叉比對,精準(zhǔn)核查元數(shù)據(jù)錯漏。目前,他已篩出500余篇存疑文獻(xiàn),經(jīng)人工逐一核驗(yàn)后,悉數(shù)公示于學(xué)術(shù)評議平臺PubPeer。
開源平臺CheckIfExist可自動核驗(yàn)參考文獻(xiàn)是否被指定學(xué)術(shù)數(shù)據(jù)庫收錄,助學(xué)者避開“查無此文”的陷阱。與此同時(shí),法國國家科研中心與卡巴納克團(tuán)隊(duì)聯(lián)合推出免費(fèi)工具bibCheck,目前已面向研究人員開放。該工具能精準(zhǔn)比對引文,核查其是否指向真實(shí)存在或已被撤回的文獻(xiàn)。
總部位于瑞士洛桑的“前沿”出版集團(tuán)亦開發(fā)了一款內(nèi)部AI篩查工具,專用于稿件初審階段標(biāo)記完整性缺陷,涵蓋“幻覺引文”與無關(guān)引文等問題。
筑牢學(xué)術(shù)堤壩
在卡巴納克看來,含有“幻覺引文”的論文絕不應(yīng)堂而皇之地出現(xiàn)于學(xué)術(shù)殿堂。一經(jīng)發(fā)現(xiàn),出版方應(yīng)立即發(fā)布聲明,并視情況啟動更正或撤稿程序。
面對此類問題,出版界的應(yīng)對策略各有側(cè)重。SAGE與泰勒-弗朗西斯集團(tuán)坦言,若查出的引文錯誤不影響結(jié)論,且不涉及更廣泛的學(xué)術(shù)不當(dāng)行為,通常采取拒稿或要求修改的處理方式。威立出版集團(tuán)發(fā)言人則表示,一般僅就細(xì)節(jié)問題向作者發(fā)函澄清。施普林格·自然出版集團(tuán)立場明確:對查實(shí)含有虛構(gòu)引用的稿件一律撤稿?!秶H政治經(jīng)濟(jì)學(xué)評論》主編約翰斯頓的態(tài)度則更為嚴(yán)格,凡向該期刊投稿被查出此類問題者,將被永久取消重投資格。
至于“幻覺引文”是否以及在何種情形下構(gòu)成學(xué)術(shù)不端,學(xué)界仍有爭議。此類疏漏有時(shí)并非作者蓄意為之,但可能釀成嚴(yán)重后果。例如,部分作者為求便捷,借助大語言模型自動排版參考文獻(xiàn),卻未察覺AI已悄然篡改引文表述、錯置DOI,甚至憑空捏造條目。今年3月,侯賽尼與美國國家環(huán)境健康科學(xué)研究所生物倫理學(xué)家戴維·雷斯尼克聯(lián)名撰文指出,若綜述或文獻(xiàn)計(jì)量研究將子虛烏有的引文作為支撐核心論點(diǎn)的關(guān)鍵證據(jù),理應(yīng)將其定性為學(xué)術(shù)不端,因?yàn)檫@無異于偽造數(shù)據(jù)。
目前,各期刊對AI工具的管控尺度不一。多數(shù)出版商雖強(qiáng)制要求作者申報(bào)AI使用情況,但具體申報(bào)范圍尚無統(tǒng)一標(biāo)準(zhǔn)。無論如何,“人工復(fù)核”始終是防范風(fēng)險(xiǎn)的最后防線。
侯賽尼等人強(qiáng)調(diào),每一處虛假引用,都是學(xué)術(shù)生態(tài)中的一道裂縫,需要人們用心修補(bǔ),還科學(xué)殿堂一片澄明晴空。
關(guān)注公眾號:人民網(wǎng)財(cái)經(jīng)
分享讓更多人看到































微信掃一掃


第一時(shí)間為您推送權(quán)威資訊
報(bào)道全球 傳播中國
關(guān)注人民網(wǎng),傳播正能量