應對AI論文造假,不妨“以AI監測AI” | 新京報快評
▲電商平臺上,商家引導顧客加*溝通論文代寫(xiě)細節。新京報資料圖。
論文代寫(xiě),一直是學(xué)術(shù)作弊黑灰產(chǎn)中的隱疾。而隨著(zhù)人工智能時(shí)代到來(lái),AI又成了其中得力的生產(chǎn)工具。
近日,據新京報臥底調查,在論文代寫(xiě)產(chǎn)業(yè)鏈中,黑灰產(chǎn)團隊已經(jīng)開(kāi)始通過(guò)AI工具來(lái)批量編造論文,并在各大平臺接單生產(chǎn)售賣(mài)。
報道中值得注意的細節是,有代寫(xiě)團隊成員向暗訪(fǎng)記者表示,因為AI代寫(xiě)工具的出現,使得論文代寫(xiě)的門(mén)檻降低,甚至出現了“職高生用AI工具幫博士生代寫(xiě)論文”的現象。
在A(yíng)IGC(人工智能生成內容)工具出現之初,行業(yè)普遍認為人工智能將能夠提升內容生產(chǎn)效率,但或許令人意想不到的是,AI工具暫時(shí)還沒(méi)有來(lái)得及在嚴肅的學(xué)術(shù)研究生產(chǎn)中得到廣泛應用,但卻率先成為了黑灰產(chǎn)業(yè)提高產(chǎn)量的工具。
在社交媒體搜索可發(fā)現,最早大約兩年前就已經(jīng)出現了一些“AI寫(xiě)論文”的教程以及小廣告,而到最近半年來(lái),已經(jīng)陸續有媒體報道過(guò)在高校、學(xué)術(shù)期刊中發(fā)現了“AI論文”的事件,甚至有國外媒體認為,學(xué)術(shù)論文正在遭遇一場(chǎng)來(lái)自“AI論文”的大規模襲擊。
從技術(shù)原理上看,目前AI工具對論文作弊的主要形式有兩種。第一種類(lèi)似于論文代寫(xiě),主要是用于一部分不需要研究數據的綜述性、分析性論文,由AI基于數據庫和提示詞進(jìn)行全量文本生成。這也是報道中所主要涉及的論文造假案例。
第二種則更為隱蔽,主要涉及到利用AI工具去編造有邏輯性的偽造數據集,從而根據偽造的數據生成符合邏輯的實(shí)驗結果、測試數據等。這類(lèi)數據造假對于使用者的要求更高,查處發(fā)現的難度也更高,而其對于學(xué)術(shù)及社會(huì )公共利益的損害也最大。
當前,對上述兩種造假情形,我們仍然沒(méi)有建立更有效的技術(shù)性防范手段。國內外不少學(xué)術(shù)期刊,最近一年內都出現過(guò)論文刊發(fā)后被發(fā)現有明顯“AI痕跡”的事。
過(guò)去,我們對學(xué)術(shù)論文造假的技術(shù)性查驗主要是“查重”,本質(zhì)上也是基于大數據對文本進(jìn)行搜索比對。
這類(lèi)技術(shù)查驗,其實(shí)是用技術(shù)工具對個(gè)人的“抄襲”行為進(jìn)行后期查核。做個(gè)不恰當的比喻來(lái)說(shuō),技術(shù)查重是用熱兵器對付冷兵器、用大數據監控個(gè)體抄襲者,因此,能夠相對有效地防范論文造假泛濫現象。
但人工智能的高速發(fā)展,使得相對傳統的查重技術(shù)逐漸失效。到了當下,變成了“大數據檢索系統”與“大模型”之間的較量,黑灰產(chǎn)和論文造假者借助大模型工具,掌握了技術(shù)上的優(yōu)勢。
因此,對這類(lèi)造假論文的發(fā)現查處,又回到了早期階段,高度依賴(lài)論文審核者的個(gè)人判斷力。例如,有高校教師此前在接受媒體采訪(fǎng)時(shí)總結過(guò),這類(lèi)文章“共同特點(diǎn)是比較水”“創(chuàng )新性不強”。
這種個(gè)體判斷力能夠發(fā)揮作用,是因為大模型生成內容仍然是“數據歸納”而不是“邏輯推理”,因為,如果審核者認真閱讀觀(guān)察文本,仍然可以準確識別出那些疑似AI造假的文章。
但面對潛在的海量造假論文、有利益驅動(dòng)的灰色產(chǎn)業(yè)鏈,個(gè)體判斷力無(wú)法成為長(cháng)期的有效防控手段。要對抗“AI代寫(xiě)”的黑灰產(chǎn),需要監管者更快升級技術(shù)工具,同時(shí),建立更加嚴格的行業(yè)性規范。即,一方面,用“AI來(lái)檢測AI”,另一方面,要對“AI工具如何使用”建立明確的標準。
當前,國內外已經(jīng)開(kāi)始研發(fā)專(zhuān)門(mén)針對“AIGC內容”的檢測工具。在部分內容平臺上,已經(jīng)開(kāi)始對疑似“AI生成內容”進(jìn)行了異常標注。
從數據檢測識別的邏輯看,這類(lèi)AI造假內容的特征相對更加明顯,通過(guò)對文本結構、用詞與語(yǔ)言模型等進(jìn)行檢測,應當可以識別察覺(jué)出AI的創(chuàng )作痕跡。
因此,在傳統的抄襲查重系統之外,至少目前,可以盡早將針對“AI內容”的檢測工具也應用到學(xué)術(shù)論文的檢測流程之中,并對疑似AI造假的內容進(jìn)行標注,輔助審核人員進(jìn)行判斷。
在技術(shù)性防范手段之外,針對AI論文造假,學(xué)術(shù)界也可以迅速行動(dòng)起來(lái),為AI工具的應用設定清晰的邊界。例如,可以使用AI輔助制作插圖,但不得進(jìn)行任何文本、數據生成,或者,AI工具的使用必須在論文的前置研究方法章節進(jìn)行仔細說(shuō)明,正文也應當進(jìn)行明確標注,如果沒(méi)有標注而被系統檢測標注,寫(xiě)作者應當受到一定程度的處罰。
盡管短期內部分黑灰產(chǎn)可以利用監管時(shí)間差非法牟利,但隨著(zhù)AI被應用于監測預警,以及行業(yè)共同規范的建立與調整,AI造假的漏洞終將被迅速填平。從長(cháng)期來(lái)看,人工智能仍然會(huì )是創(chuàng )新的朋友,而不是造假的同伙。
撰稿 / 馬爾文(媒體人)
編輯 / 遲道華
校對 / 王心