當前位置:首頁(yè) > 百科 > 正文內容

“AI界春晚”2024北京智源大會(huì ):新主角、共識和分歧

內蒙古廣告公司4個(gè)月前 (06-14)百科8
印刷廠(chǎng)直印●彩頁(yè)1000張只需要69元●名片5元每盒-更多報價(jià)?聯(lián)系電話(huà):138-1621-1622(微信同號)

“AI界春晚”2024北京智源大會(huì ):新主角、共識和分歧

“AI界春晚”2024北京智源大會(huì ):新主角、共識和分歧

每經(jīng)記者 可楊 每經(jīng)編輯 張海妮

結束圓桌對談后,人墻迅速?lài)鷶n,以月之暗面CEO楊植麟為核心,把會(huì )場(chǎng)前排的空白處填補得嚴嚴實(shí)實(shí),人們舉著(zhù)手機,寄望于伸出的胳膊能碰巧掃到楊植麟的*。楊植麟至少被現場(chǎng)參會(huì )人員簇擁圍堵了三次,才在工作人員的協(xié)助下成功離開(kāi)會(huì )場(chǎng)。

2024年6月14日至15日,備受矚目的AI領(lǐng)域盛會(huì )“2024北京智源大會(huì )”在展示中心吉印通召開(kāi)?!睹咳战?jīng)濟新聞》記者現場(chǎng)注意到,這場(chǎng)被譽(yù)為“AI界春晚”的大會(huì ),在近年來(lái)大模型浪潮的推動(dòng)下,呈現出愈發(fā)濃厚的氛圍,國產(chǎn)大模型明星公司也成為參會(huì )者關(guān)注的焦點(diǎn)。

不同于上屆以國外技術(shù)人員、從業(yè)者為主,圍繞技術(shù)探索展開(kāi)的大會(huì ),今年吉印通、月之暗面、智譜AI、零一萬(wàn)物、面壁智能等國產(chǎn)大模型公司成為論壇主角。與此同時(shí),隨著(zhù)大模型從技術(shù)競速逐步邁向落地應用,一些新的變化正在發(fā)生。

新主角:國產(chǎn)大模型站在舞臺中央

在今年的“AI界春晚”上,國產(chǎn)大模型企業(yè)成為主角。

“進(jìn)入到2023年,大模型從研究機構的科研成果開(kāi)始向產(chǎn)業(yè)界逐步發(fā)展,我們也看到,百花齊放,有越來(lái)越多的大模型在過(guò)去的這一年發(fā)布?!敝窃囱芯吭涸洪L(cháng)王仲遠在發(fā)言中提到。

王仲遠認為,以2023年為界,人工智能基本上可以分為兩個(gè)大的階段:2023年之前都屬于弱人工智能時(shí)代,即人工智能的模型是針對特定的場(chǎng)景、特定的任務(wù),需要去收集特定的數據,訓練特定的模型。比如說(shuō),戰勝人類(lèi)世界圍棋冠軍的AlphaGO在圍棋上表現得非常好,但是卻無(wú)法用來(lái)直接解決醫療問(wèn)題,雖然方法可以借鑒,但是針對不同的場(chǎng)景任務(wù)需要重新進(jìn)行數據和模型的收集和訓練。進(jìn)入2023年,隨著(zhù)大模型的發(fā)展,人工智能逐步進(jìn)入通用人工智能時(shí)代,而通用人工智能最大的特點(diǎn)就是它的規模非常大,模型具備涌現性,能夠跨領(lǐng)域通用。

2023年和2024年的北京智源大會(huì ),如同兩個(gè)對比鮮明的畫(huà)面,尤其是在大模型技術(shù)的發(fā)展和應用上,兩屆大會(huì )的嘉賓構成和議題變化,成為大模型時(shí)代飛速發(fā)展的注腳。

2024年的智源大會(huì ),嘉賓陣容發(fā)生了顯著(zhù)的變化。更引人矚目的是國內大模型公司,如吉印通、月之暗面、零一萬(wàn)物、智譜AI、面壁智能等大模型明星公司的CEO(首席執行官)與CTO(首席技術(shù)官),以及來(lái)自國內頂尖院校和研究機構的代表。此次會(huì )議更加聚焦于人工智能關(guān)鍵技術(shù)路徑和應用場(chǎng)景,從理論探討向實(shí)際應用邁進(jìn)了一大步。

在2023年的大會(huì )上,ChatGPT剛剛推出半年,國內大模型啟動(dòng)跟進(jìn),“百模大戰”剛剛迎來(lái)開(kāi)端。彼時(shí),大會(huì )的主角是來(lái)自全球的頂尖學(xué)者和科技巨擘,國內則更多以學(xué)界為主。在彼時(shí)的主論壇環(huán)節,兩組對談嘉賓分別是:Meta首席AI科學(xué)家、紐約大學(xué)教授楊立昆與清華大學(xué)計算機系教授朱軍;未來(lái)生命研究所創(chuàng )始人Max Tegmark與清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)院長(cháng)張亞勤,對談內容圍繞AI技術(shù)層面的探索展開(kāi)。

如今,變化已經(jīng)非常明顯?!鞍倌4髴稹庇萦?,折射出國內大模型市場(chǎng)的快速崛起和自主創(chuàng )新能力的顯著(zhù)提升。

隨著(zhù)大模型由科研走向產(chǎn)業(yè),人們對AGI(人工通用智能)有了更多想象。王仲遠也提到,當多模態(tài)大模型能夠理解和感知、決策這個(gè)世界的時(shí)候,它就有可能進(jìn)入到物理世界。如果進(jìn)入到宏觀(guān)世界跟硬件結合,這就是具身大模型的發(fā)展方向。如果它進(jìn)入到了微觀(guān)世界,去理解和生成生命分子,那么這就是AI For Science。無(wú)論是具身模型還是AI For Science,抑或是多模型模態(tài),都會(huì )促進(jìn)整個(gè)世界模型的發(fā)展,最終推動(dòng)人工智能技術(shù)向AGI方向發(fā)展。

一個(gè)共識:落地!落地!落地!

盡管面臨挑戰,但技術(shù)的普及與落地已經(jīng)顯著(zhù)加速,預示著(zhù)人工智能正邁向一個(gè)全新的發(fā)展階段。一個(gè)重要的共識是,在將AGI的理想帶入現實(shí)世界的路上,落地應用是重要的必答題。

“零一萬(wàn)物堅決做to C(面向個(gè)人),不做‘賠錢(qián)的to B(面向企業(yè))’,找到能賺錢(qián)的to B,我們就做,不賺錢(qián)就不做?!崩铋_(kāi)復表示。

對于大模型的落地應用,李開(kāi)復認為,在中國to C短期更有機會(huì ),國外兩者都有機會(huì )。在to C端,大模型就如同互聯(lián)網(wǎng)時(shí)代或PC時(shí)代的新技術(shù)、新平臺,將會(huì )帶來(lái)新應用,這是巨大的機會(huì )。他判斷,AI時(shí)代,第一個(gè)階段突圍的應該是生產(chǎn)力工具;第二個(gè)階段可能會(huì )是娛樂(lè )、音樂(lè )、游戲;第三個(gè)階段可能會(huì )是搜索;再下一個(gè)階段可能會(huì )是電商;然后可能會(huì )有社交、短視頻、O2O(線(xiàn)上到線(xiàn)下),這是不變的定律。

張亞勤則認為,再分層來(lái)看,目前真正賺錢(qián)的是to B,是在硬件、在芯片、在基礎設施層,這個(gè)是目前已經(jīng)發(fā)生的,但是從應用來(lái)講,是先to C再to B。對于當前的AI分層,張亞勤將其劃分為信息智能、物理智能(也稱(chēng)為具身智能)以及生物智能。在具身智能階段,面向企業(yè)的應用可能會(huì )發(fā)展得更為迅速。而到生物智能階段,情況可能恰好相反,面向個(gè)人的應用會(huì )超過(guò)面向企業(yè)的應用。各個(gè)領(lǐng)域的情況可能不盡相同,但總體來(lái)看,面向企業(yè)和面向個(gè)人的應用,包括開(kāi)源模型、商業(yè)閉源模型、基礎大模型、垂直行業(yè)大模型以及邊緣模型,都會(huì )存在。

而對于B端的落地應用,李開(kāi)復認為,to B是大模型帶來(lái)的更大的價(jià)值,而且應該更快實(shí)現,但是可惜的是在to B這個(gè)領(lǐng)域面臨幾個(gè)巨大的挑戰。

一方面部分大公司、傳統公司看不懂大模型技術(shù),不敢進(jìn)行顛覆式應用。與此同時(shí),對企業(yè)來(lái)說(shuō)這一年(大模型)帶來(lái)的最大的價(jià)值是降本,而不是創(chuàng )造價(jià)值。而降本說(shuō)實(shí)在的就是取代人類(lèi)的工作,大公司會(huì )有很多高管或者中層管理人員不愿意做這個(gè)事情,因為做了這個(gè),可能團隊就要被砍掉了,他在公司的資本就沒(méi)有了,他的權力就變小了,甚至他自己的工作都沒(méi)有了。所以大公司有時(shí)CEO是很想做,但是下面會(huì )有阻力,這些理由造成to B理論上應該馬上可以落地的,但實(shí)際上沒(méi)有那么快。

另一個(gè)在中國比較嚴重的問(wèn)題是,很多大公司沒(méi)有認識到軟件的價(jià)值,不愿意為軟件付費,而且有這么多大模型公司來(lái)競標,結果價(jià)格越競越低,做到最后是做一單賠一單,都沒(méi)有利潤?!拔覀冊贏(yíng)I1.0時(shí)代看到這個(gè)現象,現在很不幸在A(yíng)I2.0時(shí)代(它)又重現了?!崩铋_(kāi)復感嘆道。

吉印通CTO王海峰的觀(guān)點(diǎn)是,在人類(lèi)歷史上,每次工業(yè)革命的核心技術(shù),不論是機械、電氣還是信息技術(shù),均具備一些共同特性:首先,核心技術(shù)具有強烈的通用性,能夠廣泛應用于各個(gè)領(lǐng)域。其次,當這些技術(shù)具備了標準化、模塊化和自動(dòng)化的工業(yè)大生產(chǎn)特征時(shí),這些技術(shù)就會(huì )進(jìn)入到工業(yè)大生產(chǎn)階段,從而更快地改變人們的生產(chǎn)生活方式,并為人們帶來(lái)巨大的價(jià)值。當前,人工智能基于深度學(xué)習和大模型工程平臺已經(jīng)具備了極強的通用性,以及良好的標準化、自動(dòng)化和模塊化特性。因此,王海峰認為,深度學(xué)習和大模型工程平臺的結合,正在推動(dòng)人工智能步入工業(yè)大生產(chǎn)階段,從而加速通用人工智能的來(lái)臨。

一個(gè)分歧:是否仍堅信Scaling Law

圍繞“Scaling Law”(規模定律)的討論開(kāi)始出現分歧,對于Scaling Law會(huì )否失效、何時(shí)失效,明星大模型公司的掌舵者們,也給出了不同的判斷。

楊植麟依舊是堅定的Scaling Law信仰派?!癝caling Law沒(méi)有本質(zhì)的問(wèn)題,而且接下來(lái)3~4個(gè)數量級,我覺(jué)得是非常確定的事情。這里面更重要的問(wèn)題是你怎么能夠很高效地去scale(擴展)?”

楊植麟指出,如今僅僅像現在這樣,依賴(lài)一些web text(網(wǎng)頁(yè)文本)進(jìn)行scale,未必是正確的方向。因為在這個(gè)過(guò)程中可能會(huì )面臨諸多挑戰,如推理能力等問(wèn)題,未必能夠得到有效解決。因此關(guān)鍵在于如何界定Scaling Law以及其實(shí)質(zhì)是什么。如果僅按照現有方法,進(jìn)行next token prediction(下一標記預測),然后在此基礎上擴展多個(gè)數量級,用當前的數據分布,其上限是顯而易見(jiàn)的。

然而,Scaling Law本身并不受此限制,其核心是,只要具備更多的算力和數據模型,擴大參數規模,就能持續產(chǎn)生更多的智能。但在此過(guò)程中,它并沒(méi)有定義模型的具體形態(tài),例如模型的模態(tài)數量、數據的特性和來(lái)源等。因此,楊植麟認為Scaling law是一種會(huì )持續演進(jìn)的第一性原理(first principle)。只是在這一過(guò)程中,scale的方法可能發(fā)生很大變化。

百川智能CEO王小川則認為,Scaling Law到目前沒(méi)有看到邊界,依舊在持續地發(fā)揮作用,“我們看到美國埃隆?馬斯克號稱(chēng)要買(mǎi)30萬(wàn)片B100、B200來(lái)做”。

在他看來(lái),我們需要在Scaling Law之外,去尋找范式上新的轉化,而在Scaling Law上,很明確,就是在美國后面跟進(jìn)。從戰略上看,在Scaling Law之外都還存在范式的變化,走出這樣的體系,才有機會(huì )走向AGI,才有機會(huì )跟最前沿的技術(shù)較量。

智譜AI公司CEO張鵬與面壁智能CEO李大海,則持相對謹慎樂(lè )觀(guān)的態(tài)度。張鵬認為,包括Scaling Law在內,目前為止人類(lèi)認識到的所有的規律都有可能被推翻,只是看它的有效期是多長(cháng)。但目前為止還沒(méi)有看到Scaling Law會(huì )失效的預兆,未來(lái)的相當一段時(shí)間之內它仍然會(huì )有效?!半S著(zhù)大家對規律的認知越來(lái)越深,規律的本質(zhì)越來(lái)越(被)揭示,掌握本質(zhì)就能掌握通往未來(lái)的鑰匙?;诂F在大家對本質(zhì)認識的深淺,至少在我們看來(lái),(Scaling Law)仍然還會(huì )起效,會(huì )是未來(lái)我們主力想要推進(jìn)的方向”。張鵬說(shuō)。

李大海同樣表示,Scaling Law是一個(gè)經(jīng)驗公式,是行業(yè)對大模型這樣一個(gè)復雜系統觀(guān)察以后的經(jīng)驗總結,隨著(zhù)訓練過(guò)程中實(shí)驗越來(lái)越多、認知越來(lái)越清晰,會(huì )有更細顆粒度的認知。比如模型訓練中的訓練方法本身對于Scaling Law、對于智能的影響是比較顯著(zhù)的。在將模型參數控制在一定規模后,這種顯著(zhù)影響變得尤為重要,在確保終端芯片能夠支持該規模模型的同時(shí),實(shí)現優(yōu)質(zhì)智能,數據質(zhì)量和訓練方法等因素亦至關(guān)重要。

毫無(wú)疑問(wèn)的是,Scaling Law在當前階段仍然是驅動(dòng)大模型發(fā)展的重要理論基礎,但其在未來(lái)的應用和擴展方式可能會(huì )面臨更多挑戰和變化。隨著(zhù)技術(shù)的進(jìn)步和對規律本質(zhì)認識的深化,行業(yè)也可能需要進(jìn)一步優(yōu)化模型訓練方法,才能應對智能推理等更高級別的挑戰。

收藏0

發(fā)表評論

訪(fǎng)客

看不清,換一張

◎歡迎參與討論,請在這里發(fā)表您的看法和觀(guān)點(diǎn)。
中文字幕在线永久91_国产一级AV不卡毛片_亚洲日本中文字幕在线四区_日韩黄片在线大全