語(yǔ)言≠思維,大模型學(xué)不了推理:一篇Nature讓AI社區炸鍋了
方向完全搞錯了?
大語(yǔ)言模型(LLM)為什么空間智能不足,GPT-4 為什么用語(yǔ)言以外的數據訓練,就能變得更聰明?現在這些問(wèn)題有 「標準答案」了。
近日,一篇麻省理工學(xué)院(MIT)等機構發(fā)表在頂級學(xué)術(shù)期刊《自然》雜志的文章觀(guān)察到,人類(lèi)大腦生成和解析語(yǔ)言的神經(jīng)網(wǎng)絡(luò )并不負責形式化推理,而且提出推理并不需要語(yǔ)言作為媒介。
這篇論文聲稱(chēng)「語(yǔ)言主要是用于交流的工具,而不是思考的工具,對于任何經(jīng)過(guò)測試的思維形式都不是必需的」,引發(fā)了科技領(lǐng)域社區的大討論。
難道真的如語(yǔ)言學(xué)家喬姆斯基所言,追捧 ChatGPT 是浪費資源,大語(yǔ)言模型通向通用人工智能(AGI)的路線(xiàn)完全錯了?
讓我們看看這篇論文《Language is primarily a tool for communication rather than thought》是怎么說(shuō)的。
021yin.com/articles/s41586-024-07522-w
語(yǔ)言是人類(lèi)智能的一個(gè)決定性特征,但它所起的作用或多或少一直存在爭議。該研究提供了神經(jīng)科學(xué)等相關(guān)學(xué)科角度的最新證據,以論證現代人類(lèi)的語(yǔ)言是一種交流工具,這與我們使用語(yǔ)言進(jìn)行思考的流行觀(guān)點(diǎn)相反。
作者首先介紹了支持人類(lèi)語(yǔ)言能力的大腦網(wǎng)絡(luò )。隨后回顧語(yǔ)言和思維雙重分離的證據,并討論語(yǔ)言的幾種特性,這些特性表明語(yǔ)言是為交流而優(yōu)化的。該研究得出結論認為,盡管語(yǔ)言的出現無(wú)疑改變了人類(lèi)文化,但語(yǔ)言似乎并不是復雜思維(包括符號思維)的先決條件。相反,語(yǔ)言是傳播文化知識的有力工具,它可能與我們的思維和推理能力共同進(jìn)化,并且只反映了人類(lèi)認知的標志性復雜性,而不是產(chǎn)生這種復雜性。
圖 1
研究證據挑戰了語(yǔ)言對于思維的重要性。如圖 1 所示,使用 fMRI 等成像工具,我們可以識別完整、健康的大腦中的語(yǔ)言區域,然后檢查在完成需要不同思維形式的任務(wù)時(shí),語(yǔ)言區域的相關(guān)響應。
01.人類(lèi)大腦中的語(yǔ)言網(wǎng)絡(luò )
從人腦的生物學(xué)結構來(lái)看,語(yǔ)言生成和語(yǔ)言理解由左半球一組相互連接的大腦區域支持,通常稱(chēng)為語(yǔ)言網(wǎng)絡(luò )(圖 1a;Box 2 描述了它與語(yǔ)言神經(jīng)生物學(xué)經(jīng)典模型的關(guān)系)。
Box 2。許多教科書(shū)仍然使用 Wernicke 提出的語(yǔ)言神經(jīng)基礎模型,并由 Lichteim 和 Geschwind 進(jìn)行了闡述和修訂。該模型包括兩個(gè)皮層區域:Broca 區位于下額葉皮層,Wernicke 區位于后上顳葉皮層。這兩個(gè)區域分別支持語(yǔ)言產(chǎn)生和理解,并通過(guò)一條背側纖維束(弓狀束)連接。
語(yǔ)言網(wǎng)絡(luò )有兩個(gè)非常重要的特性:
首先,語(yǔ)言區域表現出輸入和輸出模態(tài)的獨立性,這是表征抽象性的關(guān)鍵特征。主要表現為在理解過(guò)程中,這些大腦區域對跨模態(tài)(口頭、書(shū)面或手語(yǔ))的語(yǔ)言輸入做出反應。同樣,在語(yǔ)言生成過(guò)程中,無(wú)論我們是通過(guò)口語(yǔ)還是書(shū)面語(yǔ)來(lái)產(chǎn)生信息,這些區域都是活躍的。這些區域支持語(yǔ)言理解和生成(圖 1a)這一事實(shí)表明,它們很可能存儲了我們的語(yǔ)言知識,這對于編碼和解碼語(yǔ)言信息都是必需的。
其次,語(yǔ)言區還能對詞義和句法結構進(jìn)行表征和處理。特別是,關(guān)于腦磁圖和顱內記錄研究的證據表明,語(yǔ)言網(wǎng)絡(luò )的所有區域都對詞義以及詞間句法和語(yǔ)義依賴(lài)性敏感(圖 1a)??傊?,語(yǔ)言網(wǎng)絡(luò )中語(yǔ)言表征的抽象性以及網(wǎng)絡(luò )對語(yǔ)言意義和結構的敏感性使其成為評估語(yǔ)言在思維和認知中的作用假設的明確目標((Box 3)。
我們對人類(lèi)語(yǔ)言和認知能力,以及它們之間關(guān)系的理解仍然不完整,還有一些懸而未決的問(wèn)題:
語(yǔ)言表征的本質(zhì)是什么?
思維是否依賴(lài)于符號表征?
兒童學(xué)習語(yǔ)言時(shí),語(yǔ)言網(wǎng)絡(luò )是如何成長(cháng)的?
02.語(yǔ)言對于任何經(jīng)過(guò)檢驗的思維形式都不是必需的
經(jīng)典的方法是通過(guò)研究大腦損傷或疾病的個(gè)體來(lái)推斷大腦與行為之間的關(guān)聯(lián)和分離。這種方法依賴(lài)于觀(guān)察大腦某部分受損時(shí)個(gè)體行為的變化,從而推測不同大腦區域的功能和行為之間的聯(lián)系。
有證據表明 —— 有許多個(gè)體在語(yǔ)言能力上有嚴重的障礙,影響到詞匯和句法能力,但他們仍然表現出在許多思考形式上的完整能力:他們可以解決數學(xué)問(wèn)題,進(jìn)行執行規劃和遵循非言語(yǔ)指令,參與多種形式的推理,包括形式邏輯推理、關(guān)于世界的因果推理和科學(xué)推理(見(jiàn)圖 1b)。
研究表明,盡管失去了語(yǔ)言能力,一些患有嚴重失語(yǔ)癥的人仍然能夠進(jìn)行所有測試形式的思考和推理,他們在各種認知任務(wù)中的完整表現就是明證。他們根本無(wú)法將這些想法映射到語(yǔ)言表達上,無(wú)論是在語(yǔ)言生成中(他們無(wú)法通過(guò)語(yǔ)言向他人傳達自己的想法),還是在理解中(他們無(wú)法從他人的單詞和句子中提取意義)(圖 1b)。當然,在某些腦損傷病例中,語(yǔ)言能力和(某些)思維能力都可能受到影響,但考慮到語(yǔ)言系統與其他高級認知系統的接近性,這是可以預料的。
尤其是一些聾啞兒童,他們長(cháng)大后很少或根本沒(méi)有接觸過(guò)語(yǔ)言,因為他們聽(tīng)不見(jiàn)說(shuō)話(huà),而他們的父母或看護人不懂手語(yǔ)。缺乏語(yǔ)言接觸會(huì )對認知的許多方面產(chǎn)生有害影響,這是可以預料的,因為語(yǔ)言是了解世界的重要信息來(lái)源。盡管如此,語(yǔ)言剝奪的個(gè)體無(wú)疑表現出復雜的認知功能能力:他們仍然可以學(xué)習數學(xué)、進(jìn)行關(guān)系推理、建立因果鏈,并獲得豐富而復雜的世界知識。換句話(huà)說(shuō),缺乏語(yǔ)言表征并不會(huì )使人從根本上無(wú)法進(jìn)行復雜的(包括符號的)思考,盡管推理的某些方面確實(shí)表現出延遲。因此,在典型的發(fā)展中,語(yǔ)言和推理是平行發(fā)展的。
03.完整的語(yǔ)言并不意味著(zhù)完整的思維
以上證據表明,迄今為止測試的所有類(lèi)型的思維都可以在沒(méi)有語(yǔ)言的情況下實(shí)現。
接下來(lái),論文討論了語(yǔ)言和思維雙重分離的另一面:與語(yǔ)言介導思維的觀(guān)點(diǎn)相反,完整的語(yǔ)言系統似乎并不意味著(zhù)完整的推理能力。
人類(lèi)語(yǔ)言是由交流壓力塑造的。
來(lái)自發(fā)育性和后天性腦部疾病的證據表明,即使語(yǔ)言能力基本完好,也可能存在智力障礙。
例如,有些遺傳疾病導致智力受損程度不同,但患有這些疾病的人的語(yǔ)言能力似乎接近正常水平;還有一些精神層面有缺陷的人,會(huì )影響思考和推理能力,但同樣不會(huì )影響語(yǔ)言。最后,許多獲得性腦損傷的個(gè)體在推理和解決問(wèn)題方面表現出困難,但他們的語(yǔ)言能力似乎完好無(wú)損。換句話(huà)說(shuō),擁有完整的語(yǔ)言系統并不意味著(zhù)自動(dòng)具備思考能力:即使語(yǔ)言能力完好無(wú)損,思考能力也可能受損。
總的來(lái)說(shuō),這篇論文回顧了過(guò)去二十年的相關(guān)工作。失語(yǔ)癥研究的證據表明:所有經(jīng)過(guò)檢驗的思維形式在沒(méi)有語(yǔ)言的情況下都是可能的。fMRI 成像證據表明:參與多種形式的思考和推理并不需要語(yǔ)言網(wǎng)絡(luò )。因此,語(yǔ)言不太可能成為任何形式思維的關(guān)鍵基礎。
MIT 研究得出結論的同時(shí),頂尖 AI 領(lǐng)域學(xué)者最近也發(fā)表了對大模型發(fā)展的擔憂(yōu)。上個(gè)星期四 Claude 3.5 的發(fā)布號稱(chēng)擁有研究生水平的推理能力,提升了行業(yè)的標準。不過(guò)也有人表示經(jīng)過(guò)實(shí)測可見(jiàn),它仍然具有 Transformer 架構的局限性。
對此,圖靈獎獲得者 Yann LeCun 表示,問(wèn)題不在于 Transformer,而是因為 Claude 3.5 仍然是一個(gè)自回歸大模型。無(wú)論架構細節如何,使用固定數量的計算步驟來(lái)計算每個(gè) token 的自回歸 LLM 都無(wú)法進(jìn)行推理。
LeCun 也評論了這篇 Nature 論文,對思維不等于語(yǔ)言表示贊同。
對此,你怎么看?
參考內容:
021yin.com/item?id=40756176
021yin.com/ylecun/status/1804834054954459539