當前位置:首頁(yè) > 百科 > 正文內容

王堅最新演講:AI、AI+以及AI基礎設施

鹽城名片加急1個(gè)月前 (09-17)百科8
印刷廠(chǎng)直印●彩頁(yè)1000張只需要69元●名片5元每盒-更多報價(jià)?聯(lián)系電話(huà):138-1621-1622(微信同號)

王堅院士在9月5日開(kāi)幕的2024年外灘大會(huì )上的演講實(shí)錄。本文來(lái)源:阿里鐵軍

021yin.com

AI、AI+以及AI基礎設施

各位來(lái)賓,非常感謝有這次機會(huì ),把過(guò)去幾年甚至幾十年有關(guān)的一些想法、一些教訓或者一些經(jīng)驗在這跟大家分享一下。

今天我自己找了三個(gè)關(guān)鍵詞,就是AI、AI+、AI基礎設施。

其實(shí)這三個(gè)關(guān)鍵詞都繞不開(kāi)一個(gè)詞叫AI。剛才Michael也講了,其實(shí)AI這個(gè)詞可能一千個(gè)人有一千個(gè)人的理解,一千人有一千人的想法。但是今天碰巧這三個(gè)不同的方面,就是AI、AI+跟AI基礎設施在今天被結合在一起了。

我經(jīng)常說(shuō)的一句話(huà),人工智能有很長(cháng)的過(guò)去,只有非常短的歷史。其實(shí)這是一個(gè)非常糾結的一件事情。事實(shí)上我覺(jué)得最困惑的就是,到今天為止,人工智能到底在說(shuō)什么事情呢?還是值得探討一下。

我想用一張圖,當時(shí)我看到以后,為什么讓我會(huì )想起人工智能有一個(gè)很長(cháng)的過(guò)去,只有很短的歷史?你今天看到那個(gè)紅線(xiàn)畫(huà)的地方,就是大概在40年代末50年代初,就是圖靈寫(xiě)了篇文章叫intelligent machines。

我自己覺(jué)得這是一個(gè)很長(cháng)過(guò)去的一個(gè)開(kāi)始,如果你要追溯關(guān)于機器智能的事情,可能可以追到幾百年以前。在圖靈這篇文章里邊,他談了一些很有意思的事情。這篇文章50年代發(fā)表的時(shí)候,是發(fā)表在心理學(xué)一個(gè)哲學(xué)的雜志上。第一次在探討關(guān)于機器跟智能之間的關(guān)系。

大家要知道在那個(gè)時(shí)候,其實(shí)計算機這個(gè)詞還沒(méi)有完全出來(lái)。所以那個(gè)時(shí)候大家還習慣把它叫做computing machinery。這就是為什么美國計算機學(xué)會(huì )會(huì )叫ACM,也是這個(gè)原因。

事實(shí)上那個(gè)時(shí)候沒(méi)有計算機這個(gè)詞,但是圖靈在那篇文章也是第一次用了數字計算機(Digital Computer)這個(gè)詞。所以這篇文章它的深遠的意義,到今天為止看,都是非常值得重新來(lái)思考。我們很多最早的概念可能都是從這邊來(lái)的。

當然大家都會(huì )講到達特茅斯這個(gè)會(huì ),我自己 (覺(jué)得)很有意思,剛才Michael特別講到了Cybermetics,我聽(tīng)完以后就很感觸,如果當年那個(gè)會(huì )不在達特茅斯開(kāi),可能這十個(gè)人的想法就被winner給滅掉了。

那可能我們今天還是叫Cybermetics來(lái)稱(chēng)呼我們今天說(shuō)的人工智能。但事實(shí)上,說(shuō)不定從單詞角度可能用Cybermetics可能會(huì )更好一點(diǎn),但人工智能就這么流行了。

那為什么在Herbert Simon(赫伯特·西蒙)這邊我打了一個(gè)紅的框呢?就是我自己對人工智能的理解,就是從Herbert Simon開(kāi)始的。

這個(gè)人很神奇,他是個(gè)心理學(xué)家,但是去參與了這個(gè)會(huì ),得了諾貝爾經(jīng)濟學(xué)獎。他第一次訪(fǎng)問(wèn)中國是1972年,是以美國計算機學(xué)會(huì )的名義到中國來(lái)的。他80年代初又以美國心理學(xué)會(huì )的名義到了中國來(lái)。

那個(gè)時(shí)候我在大學(xué)讀三年級,他到我們去講了關(guān)于人工智能。所以大家可以設想一下看,一個(gè)大學(xué)三年級的學(xué)生,在中國,在80年代初有一個(gè)人告訴你,人工智能在下面十年會(huì )有一次天翻地覆的變化。

你大概可以設想一下,那時(shí)我有多么的激動(dòng)。但事實(shí)上,等了十年沒(méi)有什么東西發(fā)生,所以后來(lái)就該干什么就干什么去了。

但事實(shí)上,里邊的很多最基礎的東西在那個(gè)時(shí)候也被提到了,甚至大家今天知道的神經(jīng)網(wǎng)絡(luò )。我印象很深,當時(shí)在80年代末的時(shí)候,有一本教科書(shū)叫PDP,就《parallel distributed processing》,那里面講的通篇都是神經(jīng)網(wǎng)絡(luò )的理論。

那時(shí)候講的都是每一層兩個(gè)節點(diǎn),只有三層,大概你能做到那個(gè)程度就結束了。但今天的規模跟那個(gè)時(shí)候沒(méi)法比。

所以我想說(shuō)的一件事情,今天的人工智能跟80年代初大家講的同一個(gè)人工智能,是一個(gè)完全不同的人工智能。我剛才講,我覺(jué)得Michael剛才也講到了這一點(diǎn)。

那為什么算是一個(gè)非常短的的歷史?

如果你看再回到剛才這張圖上,現在這個(gè)紅線(xiàn)里邊就講到了2017年,就是 Google開(kāi)始提出了transformer這件事情。

所以我想今天我們能夠談,今天人工智能又重新回到了大家的視野,又重新在產(chǎn)業(yè)上有那么大影響的話(huà),那就是從2017年開(kāi)始。所以我相信2017年以前的人工智能,跟我們今天說(shuō)的人工智能,還是有非常不同的差別。這就是我說(shuō)只有七年歷史的這個(gè)原因。

當然這段歷史就是從一篇文章開(kāi)始的,這個(gè)大家都知道。但是我想強調一下的事情就是,這文章的 8 個(gè)作者現在都不在谷歌。聽(tīng)說(shuō)有一個(gè)最近大概又回去了。Anyway也就是說(shuō),盡管它發(fā)明了很多東西,但是沒(méi)有谷歌什么事。

那這里邊有些今天大家被忽視掉的發(fā)明。比如說(shuō)第一次有了token這個(gè)概念,聽(tīng)起來(lái)好像也沒(méi)什么了不起。大家都知道今天一個(gè)商業(yè)服務(wù),大家都是用token來(lái)計價(jià)的。大家可以設想一下看,如果你連最基本計價(jià)的邏輯都不清楚的話(huà),大概是不會(huì )有一個(gè)好的產(chǎn)業(yè)的。更不用講待會(huì )我這個(gè)主題里面會(huì )講到的關(guān)于基礎設施的事情。

同樣,大家都知道在谷歌發(fā)表這篇文章的前后,就有一家公司叫OpenAI。OpenAI的出現,站在我的角度,就是讓我們重新思考一下創(chuàng )新的機制是什么。所以這就有了在2022年這個(gè)GPT的發(fā)布。

這兩件事情結合在一起,我總是覺(jué)得一件很怪的事情。所以我說(shuō)了一句話(huà)就是:谷歌很行,谷歌也很不行。

這個(gè)谷歌很行是什么呢?特別是在中國,大家都會(huì )講0到1的創(chuàng )新。所以大家可以設想一下看,谷歌是100%的完成了我們講的0到1的創(chuàng )新是吧?甚至還要多一點(diǎn)。

但為什么谷歌不行呢?我覺(jué)得大家都可能知道埃里克·施密特(Eric Schmidt)前段時(shí)間在斯坦福大學(xué)有個(gè)發(fā)言,搞得沸沸揚揚的,就是說(shuō)的谷歌非常不行。那確實(shí)也不行,為什么呢?他沒(méi)有創(chuàng )造出一個(gè)東西,像OpenAI創(chuàng )造出的那么有價(jià)值,對社會(huì )(而言)。

所以我想,這中間事實(shí)上要讓我們重新思考這個(gè)創(chuàng )新的機制到底是什么。它不是一個(gè)簡(jiǎn)單的從0到1創(chuàng )新,不是簡(jiǎn)單的你有一個(gè)好的想法。這中間的機制是遠遠超出今天學(xué)者甚至產(chǎn)業(yè)界可以來(lái)理解的。

這也是我覺(jué)得對我們一個(gè)最大的挑戰。所以我用了一個(gè)谷歌很行,谷歌也很不行。

但在這個(gè)ChatGPT后面,它的光芒事實(shí)上是對大眾而言的,不是對業(yè)界而言的,是被掩蓋了很多事情。但大家都知道有alphafold,對吧?特別是alphafold 3出來(lái)了。

但是很少人會(huì )說(shuō)它其實(shí)背后還是transformer加diffusion。可能今天大家在講這個(gè)能生成一個(gè)圖片,能生成一些大家覺(jué)得視覺(jué)上可以滿(mǎn)足大家生成的視頻。大家會(huì )講到transformer加diffusion,可是很少人理解,其實(shí)為什么谷歌那篇文章有那么fundamental。也就是說(shuō)到最后大家今天聽(tīng)到的一些最基本的東西,到最后也離不開(kāi)transformer。

當然就是說(shuō)從alphafold 2到alphafold 3,事實(shí)上他那個(gè)名字稍微做了一些改變?所以在alphafood3時(shí)候,他就用那個(gè)Pairformer,但大家都知道背后最基本的東西還是這個(gè)transformer。

再往下看,其實(shí)大家也知道,其實(shí)從ChatGPT到alphafold,到今天大家在媒體上也經(jīng)常會(huì )看到關(guān)于天氣預報的時(shí)候,這是一個(gè)三個(gè)跨度非常大的應用。但是他們到背后,我覺(jué)得有一個(gè)最基本的東西就是脫離不掉,就是transformer。

所以我想這個(gè)AI為什么只有七年歷史?

大家再回過(guò)頭來(lái)看,我們事實(shí)上是你愿意不愿意,我們生活在transformer這樣的一個(gè)陰影下,也可能是一個(gè)以后是一個(gè)陽(yáng)光燦爛的東西。所以我有時(shí)候會(huì )講到說(shuō),當你在這樣的一個(gè)背景下,再回過(guò)頭來(lái)看,去年在政府工作報告當中,多次談到了人工智能,同時(shí)提到了這個(gè)人工智能+。

所以大家設想一下看,在transformer這個(gè)邏輯下,我們要理解的人工智能+到底是什么。所以大家可能今天一談到人工智能+的時(shí)候,就會(huì )簡(jiǎn)單的加一個(gè)行業(yè)進(jìn)去。我用我自己的話(huà)來(lái)講,其實(shí)這是沒(méi)有比在人工智能+后面加一個(gè)行業(yè)把人工智能庸俗化的做法了。所以就是反復思考的人工智能+到底是什么?

所以我們再來(lái)看這個(gè)GPT,或者是我們今天要說(shuō)的這些事情的話(huà),那可能是需要有一次重新的思考的。所以這個(gè)ChatGPT如果在人工智能+這個(gè)邏輯上,大家可以認真想一下看ChatGPT不是個(gè)應用,它是個(gè)應用平臺。

就像在上一個(gè)年代這個(gè)office一樣,它不是一個(gè)應用,它是應用平臺。但如果把GPT再拆一拆,剛才講過(guò)了,它如果把它變成個(gè)基礎模型的話(huà),事實(shí)上chat就是一個(gè)應用。所以ChatGPT就是GPT加chat,這是我的理解。

但是我想多說(shuō)一句的話(huà),chat不是一個(gè)簡(jiǎn)單的應用場(chǎng)景。

大家都知道microsoft跟OpenAI這個(gè)合作過(guò)程當中,不只是做了ChatGPT。其實(shí)他們到比爾蓋茨家里討論了很多GPT這樣東西可以用到什么場(chǎng)景。最后只有ChatGPT是最革命的,所以變成了產(chǎn)品。

他們做了一大堆也很有用,但沒(méi)有革命的東西,后來(lái)都寫(xiě)成了書(shū)。所以有時(shí)候經(jīng)常開(kāi)玩笑說(shuō),這個(gè)書(shū)是很危險的,就是不是革命的東西都寫(xiě)成了書(shū),可能最革命的東西做成了產(chǎn)品,這是我們今天真正發(fā)生的事情。

所以我想沒(méi)有比OpenAI的這個(gè)公司的人對chat本身有更深的了解。

所以今天我還是要講一句話(huà),就是說(shuō)當你做不出一個(gè)比ChatGPT好的這樣一個(gè)東西的時(shí)候,至少有兩個(gè)原因在約束你。第一個(gè)當然是你的技術(shù),就是基礎,就是模型。第二就是你對這個(gè)問(wèn)題理解的深度,你能不能真正找到這個(gè)領(lǐng)域的問(wèn)題,事實(shí)上是你約束的最大的一個(gè)前提。我們往往在很多時(shí)候,其實(shí)對這個(gè)問(wèn)題不理解,以為有了GPT就可以解決很多的問(wèn)題。

當然我今天講的重點(diǎn)是這個(gè)+到底是什么?這個(gè)+就讓我想到了,大家都知道當時(shí)這個(gè)chat做這件事情的時(shí)候,事實(shí)上只是反映了比爾-蓋茨當年的一個(gè)愿景,就是讓計算機能聽(tīng)能說(shuō)。所以我想今天因為有了ChatGPT以后,就當這臺計算機變成了一個(gè)手機以后,我們今天就做到了這一點(diǎn)。

那么這背后的真正的+的機制就是ChatGPT。當我們講那個(gè)加的時(shí)候,不是加什么東西,而是怎么加,更加重要的是一個(gè)機制的創(chuàng )新。這句話(huà)聽(tīng)起來(lái)很抽象,再把它回過(guò)頭來(lái),大家可以看一看ChatGPT什么意思,這個(gè)家就是OpenAI這家公司。沒(méi)有OpenAI這家公司,GPT和chat是不會(huì )變成這樣一個(gè)影響大家的產(chǎn)品。

那OpenAI這家公司為什么是一個(gè)機制的創(chuàng )新呢?

到今天為止,其實(shí)大家都知道OpenAI是一個(gè)怪物,也就是說(shuō)它有nonprofit的OpenAI,也有OpenAI LP這樣的東西。所以大家可以設想一下看,一個(gè)noprofit一個(gè)機構跟一個(gè)商業(yè)機構在OpenAI這么一個(gè)主體里邊,被這樣莫名其妙的存在在一起。所以我想就是發(fā)生的過(guò)去發(fā)生的事情都跟OpenAI,其實(shí)大家講的OpenAI都是講的OpenAI LP。

可是當大家知道它最早創(chuàng )辦是一個(gè)非營(yíng)利機構的話(huà),大家可以想象它中間的機制是多么復雜的一件事情。所以我經(jīng)常跟投資人講,你用傳統的方法是投不出 OpenAI這樣一家公司來(lái)。

當然因為這樣的成功,讓我們重新反思了一下。就是黃仁勛說(shuō)了一句話(huà)叫ChatGPT是人工智能的iPhone時(shí)刻。

其實(shí)這句話(huà)被很多人引用,我自己一開(kāi)始聽(tīng)的時(shí)候也很激動(dòng)。但是后來(lái)想了一想,這個(gè)就不知道在說(shuō)什么,為什么呢?因為ChatGPT是什么也沒(méi)有完全說(shuō)清楚,人工智能是什么也沒(méi)有完全說(shuō)清楚,那iPhone到底是什么也沒(méi)有說(shuō)清楚,就是把這三個(gè)說(shuō)不清楚的東西放在那里變成了一句話(huà),這是讓我困惑了很長(cháng)時(shí)間。

其實(shí)大家也不要覺(jué)得說(shuō)清楚iPhone是什么是一件很困難的事情。我說(shuō)一個(gè)現象就知道了。大家說(shuō)起這個(gè)iPhone都覺(jué)得app store是它非常重要的事情。

今天任何一個(gè)人發(fā)言都說(shuō)生態(tài)多么重要,可是很少人理解。你們去看,Steve Jobs發(fā)布第一代的iPhone時(shí)候,是沒(méi)有APP store。完了如果你要講它的生態(tài)系統,當年跟Steve jobs一起發(fā)布iPhone第一代的那些公司,今天都不見(jiàn)了。所以他到底是什么?也是值得我們非常深思的。

當然這句話(huà),我自己覺(jué)得他其實(shí)抄襲了另外一句話(huà)。這是當年我自己聽(tīng)了看了非常激動(dòng)的。就是當alphafold出來(lái)的時(shí)候,alphafold 2出來(lái)的時(shí)候,有人說(shuō)了一句話(huà),大家說(shuō)是alphafold是生物學(xué)的imageNet時(shí)刻。我自己覺(jué)得這個(gè)是真正反映了技術(shù)發(fā)展的背后的。

當然這個(gè)就回到了那篇文章,就是杰弗里·辛頓(Geoffrey Hinton)跟他的兩個(gè)同學(xué)兩個(gè)學(xué)生寫(xiě)的。

這篇文章,至少在做機器學(xué)習也好,圖像識別也好,一定知道這篇文章。但你把這篇文章抽象出來(lái),它就三個(gè)東西,就是今天構成我們人工智能,大家天天在講的三個(gè)東西,就是:imagineNet,就是有組織的數據,完了有一個(gè)模型,那時(shí)候叫CNN,完了加GPU。這是第一次一篇文章完美地把三個(gè)東西結合在一起。

只不過(guò)是這三個(gè)東西在那個(gè)時(shí)候都談不上是新的,imageNet也存在了很久,CNN 也不是一個(gè)新的算法,GPU那個(gè)時(shí)候在每個(gè)網(wǎng)吧里面都有。

但是是這篇文章,這三個(gè)學(xué)生把它結合在一起,使得GPU、模型和數據成為做這個(gè)行業(yè)的一個(gè)最基本的標準。特別是GPU,是在那篇文章之后,它才成為學(xué)術(shù)界的標準,在他這篇文章之后才成為工業(yè)界的標準。

而當時(shí)他們用了兩塊GPU卡,是一個(gè)非常普通的GPU的卡。盡管這兩張GPU的卡在當時(shí)大概已經(jīng)超過(guò)了上萬(wàn)個(gè)CPU核的算力,但是這是在中國的每一個(gè)網(wǎng)吧里面都有的GPU卡。但是因為這樣發(fā)生了一次非常大的變化,所以算力重不重要?算力重要。但是在創(chuàng )新階段,大家都知道沒(méi)有比人的創(chuàng )造力再重要的事情。

那么到了今天發(fā)生的變化,為什么會(huì )引出要引出基礎設施呢?就是因為規模。

也就是說(shuō)當數據、模型、算力的規模都變成了一個(gè)巨大的變化的時(shí)候,這個(gè)時(shí)候一定要引入了新的東西,不然它沒(méi)法解決了。這個(gè)也是做IT、做程序設計的,看到這句話(huà)也很激動(dòng)。

這是Pascal的發(fā)明人曾經(jīng)寫(xiě)過(guò)一句話(huà),他說(shuō)一個(gè)嬰兒的速度的1000倍就是一架?chē)姎鈾C。

也就是說(shuō)在我們世界里面,任何的事情的規模增加了1000倍,它就會(huì )發(fā)生天翻地覆的變化。大家都知道在我剛才講的三個(gè)組合的規模上,在每一個(gè)單元都超過(guò)了1000倍。正是這1000倍,使得今天我們繞不開(kāi)一個(gè)最基本的東西,就是AI的基礎設施。

大家知道一旦有一個(gè)事情要談到基礎設施的時(shí)候,我覺(jué)得這是一個(gè)技術(shù)滲透的終極的形式。大家可以理解,你看人類(lèi)發(fā)展歷史上任何技術(shù)的發(fā)展,什么技術(shù)會(huì )對人類(lèi)產(chǎn)生最長(cháng)遠的影響,就是它變成了基礎設施。

當然是AI基礎設施不是我發(fā)明的,今天大家都在談的。所以我想為什么從AI到AI+到我們今天可以講AI基礎設施的話(huà),是一個(gè)非常值得我們深思的。那下面我也會(huì )很快說(shuō)一下,這是紅杉在一次研討會(huì )上用的一個(gè)幻燈片。把它拿過(guò)來(lái)了。拿過(guò)來(lái)的目的,只是為了看大家最下面一行,他就會(huì )叫做基礎設施。

大家看一看在云時(shí)代,在移動(dòng)時(shí)代,在A(yíng)I時(shí)代,他們覺(jué)得的基礎設施就是云計算。這里很有意思,他把蘋(píng)果是劃到了基礎設施這一類(lèi)的。同樣的大家可以看到在今天,他把英偉達也劃到了基礎設施那一類(lèi)。所以這是一個(gè)非常有意思的一個(gè)分類(lèi)方法。這個(gè)也不奇怪,為什么?英偉達大家都覺(jué)得他應該去做云計算。

作為做云計算的,我看到這張圖的時(shí)候也非常激動(dòng)。這張圖不是我畫(huà)的,但是解釋是我的解釋。就是這張圖大家看到這是六個(gè)在美國的做AI的獨角獸,那你看它背后的基礎設施的支持很有意思。

就是 OpenAI,大家都知道它得到了100億美金的投資,它背后是microsoft,第二名的背后是AWS。大家可以看到在這些企業(yè)真正背后的排名是什么?就是全世界排名第一、第二、第三、第五、第六的云計算服務(wù)商,都是今天美國獨角獸公司的背后支撐的來(lái)源。

這里大家看到很很神奇的一件事情,在這里有第一、第二、第三、第五、第六,就是沒(méi)有第四,對吧?那第四就是阿里云。我想就是說(shuō),這種基礎設施對將來(lái)這些事情的影響,從計算這個(gè)角度也能看得出來(lái)。但是我想從另外的角度也反映了這個(gè)產(chǎn)業(yè)之間的差距到底在哪里。

所以從這個(gè)角度,讓我想起了另外一句話(huà),我覺(jué)得微軟很不行,但是微軟也很行。也就是說(shuō),它在人工智能領(lǐng)域沒(méi)有做出transformer這樣的東西。但是它因為云,因為這個(gè)基礎設施,它在跟OpenAI創(chuàng )造出這么一個(gè)今天我們可以看到的東西出來(lái)的話(huà)。你從另外一個(gè)角度也可以看得出,好像微軟不行,但是微軟還是很行。

所以我想在A(yíng)I、AI+跟AI基礎設施這個(gè)邏輯上,所有人都是可以做自己可以創(chuàng )造歷史的事情。

我前幾天看到一個(gè)創(chuàng )業(yè)公司,為了證明他這個(gè)創(chuàng )業(yè)的重要性,畫(huà)了一張圖。我覺(jué)得很有意思。就是我相信今天我們老是講數據,講計算,講算法。但是大家設想一下,這些東西不在一個(gè)基礎設施里邊,事實(shí)上是沒(méi)有價(jià)值的。

我把這個(gè)紅框里面畫(huà)出來(lái),其實(shí)這張圖很有意思地告訴大家,數據是基礎設施的核心的組成部分。數據不只是一個(gè)模型的附屬品,這個(gè)數據也不只是一個(gè)計算的附屬品。只有所有這些東西變成一個(gè)完整的基礎設施的時(shí)候,我們才會(huì )有那一次更加激動(dòng)人心的創(chuàng )新。

如果大家看最前面它里面講到那個(gè)事情,去做了兩個(gè)區分,就講是在傳統的IT時(shí)代的云計算,以及在A(yíng)I時(shí)代的云計算。盡管這兩種計算有差別,但都是云計算。同樣數據也做了這個(gè)區分,就是在傳統意義上的數據,跟在A(yíng)I這個(gè)意義上的數據,它是做了這么一個(gè)細微的區分的。今天這個(gè)我就不展開(kāi)講了。

最后總結一下:就是事實(shí)上,當你看AI、AI+跟AI基礎設施的時(shí)候,你就會(huì )發(fā)現這個(gè)世界不但技術(shù)在革命,機制也在革命,基礎設施也在革命。沒(méi)有比這三項革命在同一個(gè)時(shí)間發(fā)生再令人激動(dòng)了。所以我想這些革命正在創(chuàng )造未來(lái)。

謝謝大家。■

收藏0

發(fā)表評論

訪(fǎng)客

看不清,換一張

◎歡迎參與討論,請在這里發(fā)表您的看法和觀(guān)點(diǎn)。
中文字幕在线永久91_国产一级AV不卡毛片_亚洲日本中文字幕在线四区_日韩黄片在线大全