張鈸直指人工智能行業(yè)當前問(wèn)題:沒(méi)有理論只有模型算法
8月1日,中國科學(xué)院院士、清華大學(xué)人工智能研究院名譽(yù)院長(cháng)張鈸在ISC.AI 2024第十二屆互聯(lián)網(wǎng)安全大會(huì )的演講上表示,當前人工智能還沒(méi)有理論,只有發(fā)展出來(lái)針對的模型和算法,它們都是針對特定領(lǐng)域的,軟件或硬件也都是專(zhuān)用的,市場(chǎng)很小,因此到現在為止還沒(méi)有發(fā)展出一個(gè)大型的人工智能產(chǎn)業(yè),問(wèn)題就出在這里。
張鈸現年已經(jīng)89歲高齡,過(guò)去幾十年里,他在清華大學(xué)培養了一批人工智能人才,是中國人工智能學(xué)科的奠基人之一。當前不少火熱的“清華系”大模型企業(yè)如生數科技、智譜AI、面壁智能、Kimi等,均受益于在清華打下的技術(shù)基礎,核心技術(shù)人才或直接或間接師承于張鈸。
本次演講,張鈸不僅指出了當前人工智能技術(shù)存在的缺陷和問(wèn)題,也給出了未來(lái)改進(jìn)的方向。
張鈸演講時(shí)現場(chǎng)觀(guān)眾拍攝其演講PPT 新京報貝殼財經(jīng)記者羅亦丹/攝
當考慮基礎模型時(shí),要考慮3大能力與1大缺陷
在張鈸看來(lái),因為理論的限制,人工智能產(chǎn)業(yè)的前一階段必須要結合具體的應用領(lǐng)域來(lái)發(fā)展,因此這一階段發(fā)展出的人工智能屬于專(zhuān)用人工智能,即“弱”人工智能。不過(guò),他也指出,目前基礎模型在語(yǔ)言問(wèn)題上做到了通用,“我們考慮基礎模型的時(shí)候需要考慮3大能力與1大缺陷,這點(diǎn)是非常重要,是我們考慮今后產(chǎn)業(yè)發(fā)展的出發(fā)點(diǎn)。”
他解釋稱(chēng),大語(yǔ)言模型的強大之處體現在強大的語(yǔ)言生成能力、強大的人機自然交互能力和強大的舉一反三能力,“大語(yǔ)言模型的語(yǔ)言生成屬于開(kāi)放領(lǐng)域,能夠生成多樣化的結果,所有輸出人類(lèi)都可以理解,即便是‘胡說(shuō)八道’我們也可以理解在胡說(shuō)什么,這一點(diǎn)非常重要。人類(lèi)跟機器在開(kāi)放領(lǐng)域進(jìn)行自然語(yǔ)言對話(huà),我們之前以為要通過(guò)幾代人的努力才能達到這個(gè)目標,但大家沒(méi)想到的是2020年這個(gè)目標已經(jīng)達到了。”
張鈸表示,大模型的缺陷就是“幻覺(jué)”,“因為我們要求它有多樣性的輸出,必然它會(huì )產(chǎn)生錯誤。這個(gè)錯誤跟機器都會(huì )產(chǎn)生錯誤非常不一樣,機器產(chǎn)生的錯誤往往是我們可以控制的,這個(gè)錯誤是本身的錯誤,是一定會(huì )發(fā)生的,而且我們不可控,所以,這點(diǎn)也是我們后面考慮它應用需要考慮的問(wèn)題。”
結合3大能力與1大缺陷,張鈸總結出了大模型當前適合應用的場(chǎng)景:對錯誤的容忍程度要高。他表示從產(chǎn)業(yè)情況來(lái)看,大模型的應用呈現“U”字形——前部的規劃、設計要求內容多樣性,后部的服務(wù)、推薦也要求多樣性,同時(shí)對錯誤的容忍程度較高,但中間部分就需要根據情況來(lái)考慮使用。
盡管存在問(wèn)題,張鈸還是表示不論怎樣“模型是一定要用的”,“因為有了模型底座以后,應用的效率和質(zhì)量一定會(huì )提高。過(guò)去的應用場(chǎng)景我們是在空的計算機上開(kāi)發(fā)軟件提供服務(wù),空的計算機相當于文盲,而現在有了大模型,平臺至少是個(gè)高中生,開(kāi)發(fā)效率一定會(huì )提高,以后的方向一定是這樣。”
張鈸重點(diǎn)分析了幻覺(jué)出現的根本原因,他認為模型的根本限制在于目前所有的機器所做的工作都是外部驅動(dòng),人類(lèi)教它怎么做,而不是自己主動(dòng)做。同時(shí),它生成的結果受提示詞的影響非常大,與人類(lèi)是在內部意圖的控制下完成工作有明顯的區別。
大模型未來(lái)的4個(gè)發(fā)展方向:對齊、多模態(tài)、智能體、具身智能
張鈸介紹,未來(lái)大模型有4個(gè)發(fā)展方向,對如何改進(jìn)大模型非常重要。
其一是與人類(lèi)對齊,“大模型沒(méi)有判斷對錯的能力,自己不能自我更新,都是人類(lèi)驅動(dòng)下去更新的,不突破這一點(diǎn),機器就不能自我進(jìn)化。大模型需要外部的提示,所以在人類(lèi)的驅動(dòng)下改正大模型的錯誤是我們做的第一件工作。”
其二是多模態(tài)生成,“多模態(tài)生成將來(lái)對產(chǎn)業(yè)的發(fā)展非常重要,因為大家看到大模型主要是生成文本,但是我們用同樣的辦法生成圖像、聲音、視頻、代碼之后,生成的水平是跟人類(lèi)的水平接近的。我們現在為什么圖像能生成的那么好,主要是把圖像跟文本掛鉤。所以,最本質(zhì)的是文本處理的突破。”
其三是AI Agent(智能體)的概念,“要把大模型和周?chē)奶摂M環(huán)境結合起來(lái),讓環(huán)境提示它的錯誤,因為一件事做了之后才知道對和錯,因此智能體的概念非常重要,讓環(huán)境提示智能體,讓它有反思的機會(huì ),去改正錯誤。”
其四是具身智能,“通過(guò)加上機器人,讓大模型在物理世界也能夠工作。將來(lái)如何發(fā)展通用機器人?我認為要‘軟件通用,硬件多樣化’,馬斯克宣傳人形機器人,但我認為將來(lái)不止限于人形機器人。”
在張鈸看來(lái),發(fā)展第三代人工智能,首先必須建立理論,大模型的存在沒(méi)有理論可以解釋?zhuān)?所以才會(huì )引起各種困惑和誤解,機器發(fā)展規模越來(lái)越大,理論不能解釋就會(huì )引起恐慌,得到安全、可控、可信、可靠、可擴展的人工智能技術(shù),在這一領(lǐng)域沒(méi)有發(fā)展完善之前,人工智能始終是存在安全問(wèn)題的。
新京報貝殼財經(jīng)記者 羅亦丹
編輯 岳彩周
校對 柳寶慶