深讀|“AI檢測”能否打敗“AI論文”
用AI替寫(xiě)論文涉嫌學(xué)術(shù)不端,多校宣布引入AIGC檢測服務(wù)系統——“AI檢測”能否打敗“AI論文”
前不久,一年一度的江蘇省碩士學(xué)位論文抽檢工作再次拉開(kāi)帷幕。據透露,今年的抽檢將首次探索AI評審路徑,提升論文智評水平。利用生成式AI分析數據、用AI工具輔助文獻綜述……生成式人工智能在給科研帶來(lái)一定便利性的同時(shí),也給學(xué)術(shù)道德和規范造成極大沖擊,不少大學(xué)生開(kāi)始嘗試借助AI改寫(xiě)文章,甚至直接代寫(xiě)論文。為剎住這場(chǎng)席卷而來(lái)的學(xué)術(shù)不正之風(fēng),多校宣布在論文檢測中引入AIGC檢測服務(wù)系統,判斷學(xué)生論文是否使用AI寫(xiě)作。
一些大學(xué)生論文AI寫(xiě)作痕跡明顯
近日,在悉尼大學(xué)留學(xué)的學(xué)生小嚴收到了學(xué)術(shù)委員會(huì )的郵件,被判定論文疑似AI寫(xiě)作的部分占比高達75%,將面臨被判定為學(xué)術(shù)不端的后果。
記者在調查中發(fā)現,如今不少大學(xué)生都會(huì )嘗試用AI輔助論文寫(xiě)作。南京大學(xué)生周瑞告訴記者,自己正在準備碩士畢業(yè)論文開(kāi)題報告,她偶然在社交平臺發(fā)現有人在推薦AI整理文獻綜述,便試了一試,“在網(wǎng)上篩選出文獻后,上傳到AI大模型平臺,向AI下達指令,讓其開(kāi)始撰寫(xiě)文獻綜述,不到半分鐘,AI就能完成對文獻的閱讀并生成文獻綜述。”
與其他同學(xué)一樣,周瑞也嘗試過(guò)用AI寫(xiě)論文,但很快她就發(fā)現,AI寫(xiě)出來(lái)的論文具有明顯的“非人類(lèi)寫(xiě)作”特征。比如,AI常常使用大量的首先、其次、最后等表示順序的連接詞,且句式較為單一,表達較為機械,缺乏人類(lèi)語(yǔ)言的多樣性和靈活性。“其實(shí)老師能看出來(lái)文章是否是AI寫(xiě)的,而且AI寫(xiě)的論文較為死板,不可能拿到高分。”
用AI代替人類(lèi)寫(xiě)論文,導致部分大學(xué)生對AI過(guò)于依賴(lài),降低了思考能力和學(xué)術(shù)水平。周瑞告訴記者,已經(jīng)有不少課程教師明令禁止使用AI替寫(xiě)論文,違者將取消作業(yè)成績(jì)。
AI寫(xiě)論文也讓一些商家看到可乘之機,將學(xué)術(shù)變成“生意”,助長(cháng)了學(xué)術(shù)不端之風(fēng)。記者在某網(wǎng)絡(luò )購物平臺檢索發(fā)現,有上百家提供AI寫(xiě)作的服務(wù)商,其中一家熱銷(xiāo)店鋪顯示“24小時(shí)內97人已買(mǎi)”,而在評論區,也有不少評論反饋“不好用,AI味很重”。
記者聯(lián)系到一家名為“AI寫(xiě)作大師”的AI論文寫(xiě)作服務(wù)提供商,對方表示可以提供畢業(yè)論文、課程論文、實(shí)踐報告等10余種AI代寫(xiě)服務(wù),每千字10元,只需要提供論文標題、學(xué)歷層次、論文關(guān)鍵詞、字數等信息,就可以在20分鐘左右生成范文。記者進(jìn)一步詢(xún)問(wèn)是否會(huì )被檢測出是AI寫(xiě)作?對方表示,去檢測AIGC率是有概率被檢測出來(lái)的,建議可以使用降AIGC率的輔助工具或者自己進(jìn)行修改,從而降低AIGC率,并且要求消費者能接受機器生成帶來(lái)的誤差和局限性,付款后除非系統生成失敗,否則不接受任何形式退款。
除了生成內容,還有不少大學(xué)生使用AI降低論文重復率。近日,南京大學(xué)生劉芯在提交課程論文時(shí),發(fā)現重復率高達36%,于是便使用某國產(chǎn)大模型“降重”。她對AI發(fā)出指令:請將這段話(huà)改寫(xiě),通過(guò)調整語(yǔ)序增減字數,替換同義詞等方式,避免與原文出現連續8個(gè)字相同的句子,使這段話(huà)更有邏輯,符合論文的規范。“通過(guò)一晚上的嘗試,論文重復率降到了15%。”
有專(zhuān)家提醒,由于目前很難判斷AI生成的內容源自何處,是否為原創(chuàng ),有可能在使用時(shí)將虛假信息或是受版權保護的信息摻雜到文中,產(chǎn)生侵犯知識產(chǎn)權的風(fēng)險。
“寫(xiě)作神器”還是“偷懶神器”?
記者了解到,多數學(xué)生使用AI寫(xiě)論文的原因,是為了節省時(shí)間。為什么AI寫(xiě)作可以這么快?“這其實(shí)與AI寫(xiě)作系統背后的大數據模型有關(guān)。當用戶(hù)給出主題詞,AI便會(huì )從海量的語(yǔ)料庫采集相關(guān)信息,隨后模型會(huì )根據用戶(hù)需求,推斷出滿(mǎn)足要求的文字。理論上來(lái)說(shuō),如果語(yǔ)料庫中的信息量足夠大,那么AI寫(xiě)出來(lái)的文字可以達到真人寫(xiě)作的效果。”東南大學(xué)網(wǎng)絡(luò )空間安全學(xué)院副教授宋宇波說(shuō)。
盡管如此,仍然時(shí)常有人吐槽AI會(huì )“一本正經(jīng)地胡說(shuō)八道”。宋宇波認為,其最主要原因在于,模型的推斷和預測本身并不像人一樣具備思考的能力,而只是基于現有語(yǔ)料庫中的內容重新進(jìn)行文字組合。“這是目前大模型領(lǐng)域的一個(gè)技術(shù)缺陷,也被稱(chēng)為‘幻象’。換句話(huà)說(shuō),當用戶(hù)所提問(wèn)的內容與大模型語(yǔ)料庫中的一些內容正好相符,那么AI寫(xiě)作生成的內容就會(huì )很符合現實(shí);而如果用戶(hù)提問(wèn)的內容與語(yǔ)料庫中的素材不相符,那么大模型常常會(huì )生成一段看上去符合人類(lèi)表達邏輯的語(yǔ)句,但這些內容很可能是虛假或者錯誤的。”
當AI已經(jīng)成為很多大學(xué)生的作業(yè)幫手時(shí),學(xué)校也必須應對AI對教學(xué)可能帶來(lái)的沖擊。“過(guò)去我們在學(xué)術(shù)寫(xiě)作的考核評分中,有50%是針對語(yǔ)言的應用,另外50%針對文章的布局把控和細節的詳盡程度。”西交利物浦大學(xué)語(yǔ)言學(xué)院教學(xué)副院長(cháng)夏令表示,由于A(yíng)I的出現,老師們也針對性地增加了后者的考核權重。
夏令還發(fā)現一個(gè)比較有趣的現象,“當學(xué)生越來(lái)越多使用AI助力時(shí),寫(xiě)作作業(yè)的質(zhì)量逐漸出現兩極分化的趨勢,強的學(xué)生更好了,弱的學(xué)生更弱了。”夏令猜測,可能是AI讓平時(shí)成績(jì)較差的學(xué)生有了更多“偷懶”的機會(huì ),而成績(jì)較好的同學(xué)則可以借助于A(yíng)I技術(shù)更好地提升作業(yè)的質(zhì)量。夏令認為,人工智能正對教學(xué)模式、考核標準等產(chǎn)生重要影響,“比如我們在嘗試將過(guò)去單純的寫(xiě)作考核轉變?yōu)轫椖恐瓶己耍?增加紙筆考試、提高口語(yǔ)表達考試的比重等。”
AI確實(shí)可以助力很多工作,在日常學(xué)習中不可避免地成為一些學(xué)生的“偷懶神器”。夏令說(shuō),“AI可以在幾分鐘內快速生成好幾周才能寫(xiě)出來(lái)的文本,一些學(xué)生很難不受到誘惑,而且目前傳統的查重檢測方法也無(wú)法有效識別,我們在教學(xué)上的應對方法非常有限。同時(shí),應該如何評判學(xué)生對于A(yíng)I的使用,學(xué)生是否盡到其應盡的努力,目前來(lái)看也沒(méi)有確切的答案。”
“但是,我們必須提醒學(xué)生的是,AI有其先天不足。”夏令以文獻綜述為例,AI工具所能接觸到的是可以免費訪(fǎng)問(wèn)的文件,有些收費的文獻庫是搜不到的,這導致文獻綜述的結論往往是不全面且失之偏頗的。夏令表示,做科研,AI只能做到“快速領(lǐng)路”,但每一篇關(guān)鍵文獻還是要扎扎實(shí)實(shí)地閱讀和消化,否則真正的知識會(huì )離你越來(lái)越遠。
厘清AI寫(xiě)作邊界遏制學(xué)術(shù)不端
今年4月26日,十四屆全國人大常委會(huì )第九次會(huì )議表決通過(guò)《吉印通人民共和國學(xué)位法》,將于2025年1月1日起正式施行。學(xué)位法第三十七條規定,學(xué)位論文或者實(shí)踐成果被認定為存在代寫(xiě)、剽竊、偽造等學(xué)術(shù)不端行為,經(jīng)學(xué)位評定委員會(huì )決議,學(xué)位授予單位不授予學(xué)位或者撤銷(xiāo)學(xué)位。有專(zhuān)家分析,AIGC技術(shù)可以用于輔助學(xué)位論文寫(xiě)作,但是不能用于代寫(xiě)。AI寫(xiě)出的論文并非學(xué)生自己撰寫(xiě),屬于“代寫(xiě)”范疇。
在宋宇波看來(lái),適度使用AI技術(shù)可以幫助學(xué)生快速便捷地尋找答案,并將精力集中在核心問(wèn)題的思考上;同時(shí),AI技術(shù)還可以對文章進(jìn)行潤色,使得語(yǔ)句表達更流暢更合理。“然而,一些學(xué)生放棄了自我思考,過(guò)度依賴(lài)AI技術(shù)去生成答案,甚至使用AI代寫(xiě)專(zhuān)業(yè)課程所需的論文,這是一種學(xué)術(shù)不端的行為。”
宋宇波說(shuō),就目前而言,真正想要杜絕AI代寫(xiě)論文比較難。一般來(lái)說(shuō),判斷一篇文章是否為AI代寫(xiě)的手段主要有兩種,一種是使用AI檢測工具,另一種則依靠人工經(jīng)驗判斷。“AI檢測工具實(shí)際使用下來(lái)準確率并不高,且比較容易造成誤判,因此只能作為輔助。而人工來(lái)判斷則費時(shí)費力,效率低。”
使用AI檢測工具判斷文章是否為AI生成,目前已有部分論文重復率檢測軟件開(kāi)始“試水”。記者了解到,多家論文重復率檢測平臺已開(kāi)通AIGC檢測功能,識別文本是否部分或全部由AI模型生成。但也有用戶(hù)反饋,用AI去檢測文章是否為AI生成難以確??茖W(xué)性,一些原創(chuàng )的片段也被AI系統認為是AI寫(xiě)作而成的,只要是稍顯生硬的文字就可能會(huì )被判定為AI寫(xiě)作,例如“系統的設計與實(shí)現不僅為銀行帶來(lái)了直接的經(jīng)濟效益,更為銀行長(cháng)遠發(fā)展策略的制定和執行提供了科學(xué)、系統的技術(shù)支撐,具有重要的理論價(jià)值和廣泛的應用前景”這句話(huà)被判定為疑似AI寫(xiě)作的概率為80%,而改為“系統的設計與實(shí)現給銀行帶來(lái)了直接的經(jīng)濟利益的同時(shí),也為銀行的長(cháng)遠發(fā)展策略的制定與執行提供了科學(xué)系統的技術(shù)支撐,在理論上具有十分重要的價(jià)值,其應用前景十分廣闊”,疑似AI寫(xiě)作率就降到了0。
不可否認的是,AI創(chuàng )作大模型的精進(jìn)給高等教育帶來(lái)了一定風(fēng)險。但也有專(zhuān)家認為,面對技術(shù)浪潮,“鴕鳥(niǎo)心態(tài)”不可取。與其逃避,不如正視問(wèn)題,厘清AI論文寫(xiě)作的邊界,比如可以在文獻綜述等方面適當使用AI提高效率,但在A(yíng)I代寫(xiě)論文上嚴加監管。
今年,中國傳媒大學(xué)、華北電力大學(xué)等高校相繼發(fā)布通知,宣布將在畢業(yè)論文審核過(guò)程中加入對文章使用生成式AI風(fēng)險情況的檢測。南京工業(yè)大學(xué)則要求每位學(xué)生在畢業(yè)論文答辯前原則上均需查重,并將對論文進(jìn)行AIGC檢測。
宋宇波認為,之所以一部分學(xué)生傾向用AI技術(shù)生成答案,甚至代寫(xiě)論文,其背后的一個(gè)重要原因在于這部分學(xué)生尚未建立正確的學(xué)術(shù)道德觀(guān)。這也意味著(zhù),一方面我們要幫助學(xué)生樹(shù)立正確的道德觀(guān)、價(jià)值觀(guān)和學(xué)術(shù)觀(guān),另一方面要建立相應的處罰制度,使得抄襲作假成本提升。“此外,我們還需要進(jìn)一步完善優(yōu)化相應的檢測工具,盡可能遏制學(xué)術(shù)不端現象。”
吉印通日報·交匯點(diǎn)記者 程曉琳 楊頻萍 謝詩(shī)涵 張宣