“自己寫(xiě)的畢業(yè)論文,被確診AI”
澎湃新聞?dòng)浾?袁璐 實(shí)習生 陳詩(shī)藝 李夏妍
看到AI檢測系統里,畢業(yè)論文成片的紅色和黃色時(shí),舒然感到“欲哭無(wú)淚”。她在心里反問(wèn)自己:難道我長(cháng)得這么像AI嗎?
在舒然兩萬(wàn)三千字的論文中,有幾十段文字被檢測出“中風(fēng)險”和“高風(fēng)險”。舒然解釋?zhuān)?這意味著(zhù)自己的畢業(yè)論文雖是原創(chuàng )的,卻因為“AI率較高”無(wú)法達到學(xué)校論文過(guò)審的要求。
隨著(zhù)AI的流行,不乏學(xué)生會(huì )在論文寫(xiě)作時(shí)借助AI生成。根據一些高校的官網(wǎng)消息,針對2024屆畢業(yè)生,這些學(xué)校首次發(fā)布了有關(guān)AIGC(生成式人工智能)檢測的通知,明確學(xué)生在進(jìn)行畢業(yè)設計(論文)時(shí),應嚴格遵守學(xué)術(shù)規范和學(xué)術(shù)道德,避免過(guò)度依賴(lài)智能生成內容,確保畢業(yè)設計(論文)的獨立性和原創(chuàng )性。
接受采訪(fǎng)的學(xué)生們都認為,AI檢測某種程度上的確可以防止學(xué)生用AI代寫(xiě)論文,但是目前的AI檢測功能尚不成熟。“很難理解它是怎么判斷為AI寫(xiě)作的,因為就算是人工寫(xiě)作,或者經(jīng)過(guò)修改,也會(huì )再次檢測成AI代寫(xiě)。”舒然說(shuō),用科技制裁科技的結果,會(huì )導致跟論文的要求相反。
對于那些被誤判為AI寫(xiě)作畢業(yè)論文的學(xué)生,機器反饋給他們一個(gè)數字,他們沒(méi)有申訴途徑,只能按照機器的運行邏輯修改。一個(gè)明顯的悖論是,當人工智能越來(lái)越像人類(lèi)時(shí),人類(lèi)自己寫(xiě)的句子也越來(lái)越像人工智能。此時(shí),用AI檢測是否使用AI代寫(xiě),他們的論文被誤判為AI代寫(xiě)的可能性就越高。
從“中風(fēng)險”改到“高風(fēng)險”
今年4月底,即將大學(xué)畢業(yè)的舒然和導師討論后,定下了自己畢業(yè)論文的題目。
一個(gè)月后,舒然開(kāi)始寫(xiě)論文初稿。撰寫(xiě)論文期間,她已經(jīng)進(jìn)入一家公司實(shí)習。每天下班后,她趴在電腦前絞盡腦汁,寫(xiě)到半夜才休息。周末兩天,她把所有時(shí)間都投入到論文寫(xiě)作中。
因為提前和導師商量好了論文的結構框架,寫(xiě)作過(guò)程中,舒然的思路較為清晰和順暢。除此之外,導師對她的論文格式,包括目錄、字體、表格的線(xiàn)條等都提出了更細致的要求。
大概過(guò)了半個(gè)月,她寫(xiě)完論文初稿。按照學(xué)校的要求,她的畢業(yè)論文字數要在兩萬(wàn)以上。一遍遍修改后,舒然的論文字數停留在兩萬(wàn)三千字。
學(xué)校的另一個(gè)要求是,除了一般的查重外,學(xué)生需使用一款叫“格子達”的AI工具作為論文引用檢測系統,檢測的結果必須是“低風(fēng)險”。
舒然通過(guò)上網(wǎng)查詢(xún)得知,這款軟件能夠提供論文查重、格式檢測、格式校正、論文管理等功能。論文查重主要通過(guò)與期刊數據庫比對,找出論文中內容的重復率。
不同的查重系統算法和數據庫大小不一樣,比如知網(wǎng)查重的規則是13個(gè)字符,即6.5個(gè)字連續重復就會(huì )被標紅。而AI檢測的目的在于識別出哪些內容是由AI生成,通過(guò)分析語(yǔ)言風(fēng)格、檢測重復內容、語(yǔ)法和邏輯進(jìn)行判斷。
寫(xiě)完論文初稿一個(gè)星期后,舒然發(fā)給導師。導師提出修改意見(jiàn)后,她從標題到框架全部“人工”修改了一遍,直到對自己滿(mǎn)意為止。在答辯前兩周,她將論文提交到AI工具里檢測。
在舒然提交之前,她的一個(gè)室友先進(jìn)行了AI檢測。結果是查重率13%,AI檢測“中風(fēng)險”。室友對此結果并不意外,她告訴舒然,自己的論文有一部分是AI代寫(xiě)的。
當時(shí)舒然覺(jué)得“還挺新奇”,但她心想,這樣的論文肯定重率高,自己的論文都是一個(gè)字一個(gè)字寫(xiě)的。當舒然把論文提交后,出現在她眼前的查重率只有1%,但AI報告也是“中風(fēng)險”。
這意味著(zhù),她必須降AI率,從“中風(fēng)險”降到“低風(fēng)險”。
和舒然一樣,四川大學(xué)生林天樂(lè )的畢業(yè)論文也被判定為AI代寫(xiě)。今年畢業(yè)前兩個(gè)月,林天樂(lè )突然接到學(xué)校要求查AI率的通知。交論文截止日期的前一天,他才知道學(xué)校要求學(xué)生使用維普論文檢測系統,系統顯示,可以用AI語(yǔ)言模型檢測AIGC實(shí)現快速、準確識別學(xué)術(shù)文本中的AI生成內容,可有效識別文本是否部分或全部由AI模型生成,檢測結果與論文質(zhì)量無(wú)關(guān),僅表示論文中內容片段存在A(yíng)I生成可能性的概率。
林天樂(lè )學(xué)校要求,AI率要低于30%。超過(guò)這個(gè)比例,論文盲審不能通過(guò),就無(wú)法畢業(yè)。他上傳論文后,查出來(lái)的結果是37%。林天樂(lè )表示,標成AI的那些內容,都是他自己寫(xiě)的。
在這之前,他已經(jīng)在知網(wǎng)上查過(guò)一遍,查出來(lái)的重復率是百分之零,所以他對自己的論文比較放心。直到要交初稿的當天,老師建議他再加新的內容進(jìn)去,他又繼續修改,到下午才定稿。“感覺(jué)自己這么努力,到交之前還手忙腳亂, AI率卻被判為37%,內心挺氣憤的。”
林天樂(lè )在社交平臺上吐槽檢測結果。本文圖片均為 受訪(fǎng)者供圖
因為已經(jīng)保送了研究生,林天樂(lè )對自己的論文要求較高。每天早上9點(diǎn),他就跑到實(shí)驗室打卡寫(xiě)論文,一直寫(xiě)到晚上八九點(diǎn),有時(shí)候熬夜寫(xiě)到十一二點(diǎn)。持續了一個(gè)學(xué)期,論文寫(xiě)了近四萬(wàn)字。
原本信心十足,讀博士的師兄也夸贊他論文內容豐富,圖表畫(huà)得好看,查重率從來(lái)沒(méi)超過(guò)3%,卻被檢測出AI代寫(xiě),林天樂(lè )心情跌落谷底。
你的AI率降下來(lái)了嗎?
剛開(kāi)始改論文,舒然根據軟件里標紅和標黃的提示,自己琢磨修改。對于那些跟其他內容相似的句子,“看著(zhù)它有點(diǎn)像AI”,便逐字逐句地改。
她念的是國際經(jīng)濟與貿易專(zhuān)業(yè),論文中涉及不少專(zhuān)業(yè)術(shù)語(yǔ)的概念解釋。但令她苦惱的是,這些固定的解釋最容易被AI系統標紅,而她又無(wú)法“創(chuàng )造出一個(gè)新的概念”。
她的具體修改方式是,用同義詞替換,或者調整一下句子的順序,或者用一些更“高級”的詞匯,以此對抗“AI給出的機械和低級的詞句”。但她沒(méi)想到,再次檢測的結果竟變成了“高風(fēng)險”。
舒然內心徹底“破防”。她并不知道其中的算法和規則,只知道軟件會(huì )標出不同的風(fēng)險段數,標紅的是高風(fēng)險,標黃的是中風(fēng)險,標綠的是低風(fēng)險。第一次檢測結果中,她論文中的“中風(fēng)險”有35段,改完之后變成了五十幾段。
舒然修改論文后變成“高風(fēng)險”。
論文被判成“高風(fēng)險”之后,舒然先冷靜了一個(gè)晚上。第二天,她開(kāi)始上網(wǎng)到處搜索降低風(fēng)險的方法。剛開(kāi)始,她嘗試了幾款可以降AI率的AI工具,“但都沒(méi)啥用。”
之后,她又搜到一些大學(xué)畢業(yè)生降AI率的經(jīng)驗分享帖,說(shuō)要去掉論文中“首先”、“其次”、“和”等字詞,以及調換語(yǔ)句和語(yǔ)序等等。她用這種方法再次修改了一遍論文,論文又變回到“中風(fēng)險”。
改了一天后,又回到起點(diǎn)。舒然覺(jué)得這樣的修改方法太慢,于是繼續上網(wǎng)搜尋。這次,她通過(guò)提煉其他人降AI率的經(jīng)驗,總結出一句她背得“滾瓜爛熟的法則”,即“復雜變簡(jiǎn)單,正話(huà)反說(shuō),主動(dòng)變被動(dòng),簡(jiǎn)單變復雜”。
距離交論文定稿的時(shí)間只剩下兩天,舒然和室友們的論文都被判為“高風(fēng)險”或者“中風(fēng)險”。“她們有的是用AI代寫(xiě)的,有的是從別人論文里面抄的,也有自己寫(xiě)的”。舒然說(shuō),她們檢測結果相似,都是查重率不算很高,但是AI率很高。
熬到凌晨三點(diǎn),那個(gè)晚上,宿舍里彼此間說(shuō)得最多的話(huà)是:“你的AI率降下來(lái)了嗎?”
學(xué)校雖然提供了一次免費的檢測機會(huì ),但舒然想用在最終稿上,因為檢測報告一出來(lái),系統會(huì )直接提交給老師。她先后自己花了200多塊錢(qián),購買(mǎi)了四次檢測機會(huì )。
她感覺(jué)論文像做了一次次體檢,“檢查出來(lái)都是病。”報告很詳細,“甚至可能就幾個(gè)字重了,也會(huì )標紅。”
降AI率的過(guò)程中,舒然腦中盤(pán)旋的一直是導師的話(huà):論文過(guò)不了,會(huì )影響畢業(yè)。答辯之后還會(huì )抽查,抽檢不過(guò)關(guān)的,后果很?chē)乐亍?
天快亮的時(shí)候,舒然不記得是第幾次改完整篇論文。再次檢查,雖然報告上仍有幾段顯示是“中風(fēng)險”和“低風(fēng)險”,但整體結果是她無(wú)比期待的“零風(fēng)險”三個(gè)字。
她舒了一口氣,迫不及待跟同學(xué)分享自己降AI率的方法,熬夜幫室友的論文改至“低風(fēng)險”。“室友開(kāi)心得不得了,說(shuō)你就是我們宿舍的神。”
但是舒然感覺(jué),她把室友的論文也改得“難以入目”。為了降AI率,她和其他同學(xué)一樣,不再顧及論文內容的通順和流暢。不過(guò),最后她還是順利通過(guò)了答辯。
和舒然一樣,林天樂(lè )也上網(wǎng)搜尋了各種降AI率的方法。同學(xué)建議他用AI軟件降AI率,他拒絕了。自己又重新寫(xiě)了三遍,最后一氣之下直接“爆刪”。
但論文查出來(lái)的AI率仍有30.13%,他覺(jué)得自己可能要延期畢業(yè)了。他記得那個(gè)夜晚,班里幾乎所有同學(xué)跟他一樣,因為AI率通宵熬夜修改論文。
起初,學(xué)校通知是這天零點(diǎn)前交稿,由于A(yíng)I檢測系統不穩定,很多同學(xué)沒(méi)有成功交上去,學(xué)校不得不把截稿時(shí)間推遲到第二天的中午12點(diǎn)。
林天樂(lè )后來(lái)降AI率的心得是,少用連接詞,句中多用逗號,多個(gè)短句共用一個(gè)主語(yǔ)。
為了更快速和高效,被檢測標紅的部分,林天樂(lè )全部刪掉,直接再重寫(xiě)一遍。改了三遍之后,論文中仍然有標紅的地方,他繼續改寫(xiě)一遍,最后AI率只降了不到7%。
截稿時(shí)間越來(lái)越緊迫,他只能繼續刪掉標紅的幾千字。他知道這對論文內容有一定影響,“觀(guān)感沒(méi)有之前那么好,但是沒(méi)有辦法,至少能順利畢業(yè)了。”
“故意暴露人類(lèi)的缺點(diǎn)”
當同學(xué)問(wèn)舒然降AI率的方法時(shí),她半開(kāi)玩笑地說(shuō),其實(shí)就是“故意暴露一些人類(lèi)的小缺點(diǎn)”,比如寫(xiě)得沒(méi)那么通順。
降AI率成功的喜悅沒(méi)有持續幾分鐘,舒然開(kāi)始感到失落。自己用盡心思寫(xiě)出來(lái)的論文,經(jīng)過(guò)“縫縫補補”,最后變得“支離破碎”,并沒(méi)有達到她想要的目標。
這也讓她思考,當AI越來(lái)越智能化,它寫(xiě)出來(lái)的東西“很高級、很專(zhuān)業(yè),越來(lái)越接近人類(lèi)時(shí),又用AI檢測系統讓我們去降低AI率,那不就是把我們自己變得不像人類(lèi)了嗎?”舒然覺(jué)得,這是一個(gè)悖論。
舒然論文修改前被AI標黃。
舒然論文修改后不再被標黃,但語(yǔ)句變得不通順。
針對被誤判的行為,受訪(fǎng)大學(xué)生們的共同疑問(wèn)是,程序是怎么判定的?“很多人用AI是為了將自己的口語(yǔ)變得學(xué)術(shù)化,現在為了避檢,卻要故意將學(xué)術(shù)化語(yǔ)言改得更口語(yǔ)化。”浙江一所高校的大四畢業(yè)生古思琪說(shuō)。
去年12月,古思琪完成了畢業(yè)論文的開(kāi)題報告。今年2月,她開(kāi)始寫(xiě)初稿。查閱資料、構思和寫(xiě)稿,大概花了兩周時(shí)間,她把論文初稿交到老師手中。之后再根據老師的建議修改,一篇本科畢業(yè)論文便算完成。
古思琪就讀的學(xué)校今年也有新的規定。不同于往年的紙質(zhì)版定稿,學(xué)生需通過(guò)知網(wǎng)系統上傳論文。定稿之后,到了5月,學(xué)校才通知學(xué)生,要查AI率。古思琪心想,我都寫(xiě)好了,不會(huì )再改了吧。“老師只說(shuō)如果評優(yōu)的論文(AI率)需要在10%以下,但沒(méi)有說(shuō)合格的論文AI率要低于多少。”古思琪回憶。
論文上傳到檢測系統后,古思琪發(fā)現,她自己寫(xiě)的某一段話(huà),“一個(gè)邏輯性很強的結論”,卻被認定為是AI寫(xiě)的。雖然沒(méi)有具體的比例要求,但老師說(shuō)盡量把論文的AI率降下來(lái)。降之前,古思琪論文的AI率是38%。
于是她不得不把邏輯詞去掉,讓前后句子的關(guān)聯(lián)度變弱,或者調換段落順序,或者把幾段內容壓縮成一段。打亂之后,“反而更像是機器寫(xiě)的了。”不過(guò)改了半天后,論文的AI率的確降了下來(lái)。
但是古思琪覺(jué)得自己論文中“亮點(diǎn)的內容”,最后都變得“平平無(wú)奇”。“這讓我看論文的時(shí)候心里很難受”。
她聽(tīng)說(shuō)可以用AI降AI率后,也嘗試過(guò)用ChatGPT和其他軟件。當時(shí)她想清除關(guān)聯(lián)詞的部分,但最后的結果和她自己想寫(xiě)的“完全無(wú)關(guān)”。
古思琪覺(jué)得,“AI的邏輯和人的邏輯有一定的差距。它會(huì )帶有一些人的想法,但是沒(méi)有我們人寫(xiě)得那么順暢,看著(zhù)很別扭。”她說(shuō),AI只會(huì )抓住一些關(guān)鍵詞,識別論文是否是AI寫(xiě)的。所以,用AI來(lái)改AI率就顯得很矛盾。
反反復復修改之后,林天樂(lè )已經(jīng)降低了自己的“學(xué)術(shù)要求”。強行改變行文邏輯,也讓他感到“錯亂”。“從小到大一直使用的連接詞,可以讓文章比較通暢,現在都不能用,好像已經(jīng)變成AI專(zhuān)屬。”
雖然最后林天樂(lè )的論文如愿以?xún)敱辉u為優(yōu)秀畢業(yè)論文,但他仍有種無(wú)處訴說(shuō)的冤屈感。“根本沒(méi)用過(guò)AI寫(xiě),難道要讓人承認沒(méi)做過(guò)的事情嗎?”他為此難過(guò)了幾天。
科技“制裁”科技
一篇論文生產(chǎn)提交的前后,AI作為使用的輔助工具,再用作檢測AI代寫(xiě)的系統,之后再成為降AI率的工具,“AI主導了一切”,林天樂(lè )說(shuō)。
林天樂(lè )的專(zhuān)業(yè)是自動(dòng)化方向,有時(shí)他會(huì )使用AI詢(xún)問(wèn)某句代碼的相關(guān)含義,“AI會(huì )給出比人更加耐心和詳細的回答”。他認可AI是一種實(shí)用工具。但是對于通過(guò)AI查論文的AI率,他覺(jué)得檢測標準和準確率并不能令人信服。
林天樂(lè )曾將自己的困惑告訴論文指導老師。老師覺(jué)得,檢測系統目前的確不太智能,但學(xué)校已有相關(guān)規定。除了鼓勵他加緊修改外,也沒(méi)有其他辦法。
林天樂(lè )就讀的學(xué)校今年是第一次進(jìn)行AI檢測畢業(yè)論文。雖然系統還在公測階段,但已經(jīng)開(kāi)始使用。“之前不是說(shuō)《學(xué)位法》要檢測AI,但是最終法律把AI那條刪掉了。因為它本來(lái)就只能根據簡(jiǎn)單的措詞來(lái)判斷,而且是疑似。”
他指的是在2023年8月審議的《吉印通人民共和國學(xué)位法(草案)》中,草案明確學(xué)位論文或者實(shí)踐成果存在抄襲、剽竊、偽造、數據造假、人工智能代寫(xiě)等學(xué)術(shù)不端行為的,經(jīng)學(xué)位評定委員會(huì )審議決定由學(xué)位授予單位撤銷(xiāo)學(xué)位證書(shū)。
但在今年4月最終頒布的《學(xué)位法》中,人工智能代寫(xiě)并沒(méi)有被納入學(xué)術(shù)不端行為的考量。“不過(guò)一些學(xué)校目前已經(jīng)開(kāi)始進(jìn)行AI檢測”,重慶一所高校的老師說(shuō),高校引入“AIGC(生成式人工智能)檢測服務(wù)系統”,多是出于學(xué)術(shù)誠信的考慮,確保論文的原創(chuàng )性,并以此抵制人工智能代寫(xiě)論文的行為。
部分學(xué)校的通告顯示,人工智能工具僅可用于文獻檢索、數據處理等輔助工作,嚴禁直接應用于論文撰寫(xiě)。但是,不同學(xué)校對于人工智能生成內容比例的要求并不相同。
在拼命降AI率的過(guò)程中,古思琪有同樣的困惑:“AI的判斷,是準確和可靠的嗎?”
她聽(tīng)有同學(xué)說(shuō)自己在致謝里感謝某位老師的話(huà)語(yǔ),也被標成AI寫(xiě)作了。她不知道自己的論文被判為AI代寫(xiě)的原因,改起來(lái)也無(wú)從下手。最初改完之后一查,只下降了1%。
最后有幾段內容,她實(shí)在不知道怎么修改,也不能刪掉。于是她用降重的方法,先翻譯成英語(yǔ),再翻譯回中文,AI率最終降到學(xué)校要求的15%。她身邊有同學(xué)為了降AI率,先把中文翻譯成愛(ài)沙尼亞語(yǔ),再翻譯成中文。
古思琪同組內有一個(gè)同學(xué),論文的引言和致謝都是AI寫(xiě)的,就這樣直接發(fā)給老師后,老師把學(xué)生“痛批”了一頓,“這樣的行為肯定是學(xué)術(shù)不端。但是如果自己的想法大于人工智能的參與,AI就只是一種工具。”
在學(xué)校要求開(kāi)始查AI率之后,古思琪跟導師交流過(guò)。她的導師平時(shí)很喜歡使用AI輔助教學(xué),也不限制學(xué)生使用AI。導師覺(jué)得使用AI能幫助學(xué)生拓展思維,“比如AI給出了三種想法,如果你能不限于A(yíng)I的想法,拓展出四五種,就掌握了和AI互動(dòng)的主動(dòng)權。”
未來(lái),古思琪打算讀研究生,她認為之后的論文可能都會(huì )進(jìn)行AI檢測,檢測是必要的,“因為現在的確有很多人直接用AI代寫(xiě)”。但是她自己寫(xiě)的內容,也被判定為AI代寫(xiě),說(shuō)明系統還不完善。
六月,舒然通過(guò)了論文答辯,順利拿到了畢業(yè)證。畢業(yè)論文躺在她的電腦中。偶爾,她會(huì )回想起降論文AI率的“痛苦過(guò)程”,好像只是“稀里糊涂”完成了一個(gè)任務(wù)。
對于那個(gè)判定她代寫(xiě)的系統,她依然一無(wú)所知。
(為保護受訪(fǎng)者隱私,文中人物均為化名)
來(lái)源:澎湃新聞