OpenAI o1與人工智能的過(guò)去與未來(lái)
經(jīng)濟觀(guān)察報 楊蔚/文 2024年9月13日,人工智能研究公司OpenAI發(fā)布了最新版本的o1模型預覽。令人意外的是,這個(gè)號稱(chēng)能夠解決大模型在數理邏輯方面缺陷和幻覺(jué)問(wèn)題的重大更新,卻并沒(méi)能延續ChatGPT-4和Sora(人工智能文生視頻大模型)的矚目,公眾的關(guān)注中多了一份謹慎和審視。
為什么不是GPT-5?性能是否真的達到了宣傳中的效果?OpenAI的著(zhù)名法則,“算”力出奇跡的Scaling Law(縮放定律)是否已走到極限?相比ChatGPT推出伊始的勢如破竹,一次次OpenAI新品發(fā)布不斷發(fā)酵的卻是逐步積累的質(zhì)疑和猜想。經(jīng)歷最初的驚艷和狂熱后,公眾對于大模型技術(shù)和應用的潛力和未來(lái)了更多不同的聲音。
與其他技術(shù)創(chuàng )新相比,人工智能技術(shù)似乎展現出更為明顯的周期性,常常在公眾和資本熱度過(guò)后引發(fā)爭議,甚至陷入沉寂。然而,歷史證明,社會(huì )輿論和投資者預期的劇烈波動(dòng)并不能真實(shí)反映人工智能技術(shù)的發(fā)展軌跡和內在價(jià)值。人工智能技術(shù)及其應用的突破,往往是在沉寂與質(zhì)疑中醞釀并最終爆發(fā)的。
AlphaGo的前塵往事
時(shí)間回到2010年。當時(shí)的人工智能技術(shù)發(fā)展可以說(shuō)正處于黎明前最后的黑暗時(shí)刻。彼時(shí)還是助理教授的李飛飛剛剛發(fā)布了Imagenet——世界首個(gè)大型的非結構化圖片數據庫。
直到兩年后,當今人工智能的主流技術(shù)卷積神經(jīng)網(wǎng)絡(luò ),才在基于這個(gè)數據庫的視覺(jué)識別比賽中,超越其他技術(shù)路徑異軍突起。而人工智能對于高度模糊、變動(dòng)性不確定性極大的語(yǔ)言文本分析處理能力,更是無(wú)從談起——基于卷積神經(jīng)網(wǎng)絡(luò )的注意力機制改進(jìn),也就是我們現在大語(yǔ)言模型的基礎,更是直到2017年才初具雛形。
在這樣的技術(shù)混沌期,一個(gè)名不見(jiàn)經(jīng)傳的人工智能初創(chuàng )企業(yè)悄然在英國倫敦誕生了。回顧這家企業(yè)當時(shí)網(wǎng)站上簡(jiǎn)略模糊的信息,我們很難想象它會(huì )在日后成長(cháng)為巨大影響力的獨角獸,并在人工智能發(fā)展中引起軒然大波。企業(yè)由一個(gè)沒(méi)有任何人工智能經(jīng)驗的神經(jīng)外科博士和他的同事創(chuàng )辦,沒(méi)有產(chǎn)品,沒(méi)有技術(shù)專(zhuān)利,也沒(méi)有收入。網(wǎng)站上僅有的信息,顯示這家公司是在探索和游戲、機器學(xué)習、電子商務(wù)算法相關(guān)的人工智能。
令人意外的是,這家大西洋彼岸的初創(chuàng )企業(yè)DeepMind引起了馬斯克的注意。在特斯拉業(yè)務(wù)初見(jiàn)起色的2011年,他以天使投資人的身份參與到了DeepMind的發(fā)展中。
有趣的是,馬斯后來(lái)說(shuō)起對Deep-Mind的投資,是出于對電影《終結者》的恐懼,這與5年后他成立OpenAI的初衷如出一轍。值得注意的是,馬斯克早期的經(jīng)營(yíng)重點(diǎn)更多還是放在了特斯拉上,對于外部初創(chuàng )企業(yè)的投資,其實(shí)并不頻繁。但這兩家有著(zhù)馬斯克身影的初創(chuàng )型組織,雖然沒(méi)有像馬斯克希望的那樣去真正解決人工智能的倫理和風(fēng)險問(wèn)題,卻兩度成為推動(dòng)這一技術(shù)從低谷走向高峰的最重要力量。
DeepMind的真正轉機出現在馬斯克投資之后,即谷歌的收購要約。谷歌在2014年以6.6億美元的超高溢價(jià),打敗了同為硅谷巨頭的競爭對手臉書(shū),收購了DeepMind及其團隊。至此,這家一直尋覓技術(shù)路徑和應用場(chǎng)景的初創(chuàng )企業(yè),似乎找到了別具一格的探索方向——研究用人工智能下圍棋。
對計算機對弈算法的研究其實(shí)并不鮮見(jiàn),最早可以追述至人工智能誕生伊始。IBM的深藍在1997年就在國際象棋的競技中打敗了人類(lèi)選手。但圍棋的難度是空前巨大的,圍棋棋盤(pán)中兩子對奕所衍生出來(lái)的棋路可能性,甚至超過(guò)整個(gè)宇宙中原子的數量總和。圍棋戰略對抗中高度的復雜性,意味著(zhù)優(yōu)秀的圍棋選手不僅依靠大強度的訓練,更是在經(jīng)驗積累中不斷強化的天賦和直覺(jué)。傳統的計算機程序依靠窮舉或暴力演算搜尋,顯然無(wú)法復制頂尖棋手對弈決策中罕見(jiàn)的天賦型能力,超越更是無(wú)從談起。在DeepMind之前的數十年,計算機的圍棋水平僅能勉強對戰業(yè)余選手。
當DeepMind宣布要用其開(kāi)發(fā)的人工智能?chē)宄绦駻lphaGo挑戰世界頂尖的九段圍棋高手、已經(jīng)拿下18個(gè)冠軍頭銜的李世石時(shí),無(wú)論是計算機科學(xué)家還是圍棋界都普遍都認為人類(lèi)的勝利在這樣的挑戰中幾乎毫無(wú)懸念。李世石本人在賽前曾預測,“5盤(pán)棋不應該是3/2,也許是4/1或5/0,但我一定會(huì )贏(yíng)”。
這場(chǎng)發(fā)生在2016年3月的結果卻出乎所有人意料,AlphaGo以4:1的成績(jì)戰勝了李世石,震驚世界。當代人工智能技術(shù)通過(guò)圍棋,這一古老且家喻戶(hù)曉且具有社會(huì )驗證屬性的策略競技方式,空前直白地展現出驚人潛力。AlphaGo勝利所帶來(lái)的軒然大波與7年后ChatGPT的火爆如出一轍,都深刻地塑造了其后人工智能技術(shù)的發(fā)展。
AlphaGo的影響首先出現在相關(guān)的開(kāi)發(fā)者社區當中。我和美國杜蘭大學(xué)的張吉印通教授2022年發(fā)表于《戰略管理期刊》(StrategicManagementJour-nal)的研究中,通過(guò)分析開(kāi)發(fā)者問(wèn)答社區Stackoverflow和世界上最大的開(kāi)源代碼平臺GitHub的開(kāi)發(fā)者行為數據發(fā)現,AlphaGo使得開(kāi)發(fā)者在人工智能創(chuàng )新中,能夠更好的運用平移、類(lèi)比等思維認知模式提出更為復雜的問(wèn)題。而復雜問(wèn)題的求解,是新興技術(shù)突破后進(jìn)一步創(chuàng )新的關(guān)鍵。
AlphaGo通過(guò)圍棋挑戰所得到的社會(huì )范圍的關(guān)注、認可和性能驗證,不僅進(jìn)一步確定了其選擇的深度學(xué)習的技術(shù)潛力,更激勵和影響了人工智能領(lǐng)域的投資活動(dòng)和人才儲備。正是這些微觀(guān)基礎層面的悄然變革奠定了日后整體人工智能技術(shù)發(fā)展的基礎。
技術(shù)成功之后
AlphaGo出人意料的成功,背后離不開(kāi)母公司谷歌的支持。早在2004年上市時(shí),谷歌就擁有硅谷最大的服務(wù)器集群之一,更是在2015年就推出了自己的專(zhuān)有算力芯片TPU,其計算能力甚至超過(guò)了當時(shí)的主流運算芯片英偉達。強大的算力是深度學(xué)習人工智能算法發(fā)展不可或缺的配套資產(chǎn)。
值得注意的是,DeepMind在被收購后,不再需要直接應對大部分營(yíng)收壓力。作為谷歌子公司,DeepMind在人工智能上取得的科研成果,更多是面向谷歌內部的轉化,被應用到其搜索、視頻推薦和數據中心能源系統管理等業(yè)務(wù),這使得DeepMind在很大程度上可以不計成本地專(zhuān)注研發(fā),不斷推進(jìn)技術(shù)本身的性能潛力。
新興技術(shù)的突破,往往是初創(chuàng )企業(yè)與技術(shù)巨頭通力合作的結果,這樣的互動(dòng)還會(huì )進(jìn)一步塑造技術(shù)的發(fā)展。
初創(chuàng )企業(yè)通常被視作顛覆性技術(shù)的來(lái)源,具有極大的創(chuàng )造力和探索精神,但商業(yè)化過(guò)程中,卻面臨缺乏市場(chǎng)經(jīng)驗、客戶(hù)資源和配套資產(chǎn)的挑戰。巨頭和成熟企業(yè)往往具備很強的商業(yè)化能力以及相關(guān)資源,但因路徑依賴(lài)和長(cháng)期發(fā)展積累的組織惰性,往往在研發(fā)過(guò)程中只能基于現有的成功產(chǎn)品進(jìn)行漸進(jìn)式創(chuàng )新搜尋。
因此,初創(chuàng )企業(yè)和巨頭通過(guò)并購、戰略投資等合作,不僅能推動(dòng)初創(chuàng )企業(yè)的技術(shù)創(chuàng )新,也成為技術(shù)巨頭獲取新技術(shù)的重要窗口和通道。
我在與美國得克薩斯大學(xué)奧斯汀分校 McCombs商學(xué)院的 FranciscoPolidoro教授的合作研究中發(fā)現,生物制藥領(lǐng)域的重大創(chuàng )新同樣離不開(kāi)大型藥廠(chǎng)戰略投資的參與,這樣的戰略投資和并購也會(huì )影響新興技術(shù)其后的發(fā)展。為了更好的利用巨頭的配套資產(chǎn),初創(chuàng )企業(yè)的技術(shù)路徑會(huì )向巨頭逐漸靠攏。
在人工智能領(lǐng)域,AlphaGo對于谷歌人工智能算法和服務(wù)器的利用,同樣展現出這樣的特點(diǎn),并直接影響技術(shù)性能的發(fā)展,進(jìn)而決定AlphaGo與李世石對決中的勝利。
然而,AlphaGo所引發(fā)的熱潮并未能一直持續。圍棋的復雜性、競技性和對抗性與典型可變現的商業(yè)化應用場(chǎng)景具有很大的區別。熱度散去后,深度學(xué)習的商業(yè)前景開(kāi)始受到質(zhì)疑。DeepMind選擇蛋白質(zhì)解析這個(gè)在生物學(xué)中看似極為專(zhuān)業(yè)聚焦的領(lǐng)域作為商業(yè)化的第一個(gè)嘗試,似乎也驗證了公眾對于深度學(xué)習商業(yè)化潛力的質(zhì)疑。
在A(yíng)lphaGo基礎上的AlphaFold展示出同樣驚人的性能潛力,通過(guò)預測蛋白質(zhì)內極大的數量的氨基酸形態(tài)解析蛋白質(zhì)結構,2年內完成了超過(guò)15萬(wàn)個(gè)人類(lèi)蛋白質(zhì)解析,超過(guò)生物學(xué)家過(guò)去50年通過(guò)傳統方法完成工作量的3倍。然而,社會(huì )卻因為這一基礎領(lǐng)域探索在應用廣度上的局限,對技術(shù)整體的商業(yè)化前景產(chǎn)生了質(zhì)疑,寄予深度學(xué)習的關(guān)注和期望在這個(gè)期間逐漸降溫,風(fēng)險投資的增長(cháng)也逐步趨緩。
但實(shí)際上,深度學(xué)習技術(shù)真正蛻變成具有更為廣闊應用潛力的通用性技術(shù),卻是在這樣的社會(huì )驗證引發(fā)的關(guān)注高潮過(guò)后、在公眾熱情退卻的冷靜期悄然實(shí)現的。
2020年,AlphaFold2推出,在其后的2年內完成超過(guò)100萬(wàn)個(gè)物種2.14億中蛋白質(zhì)結構的預測解析,幾乎涵蓋了世界上全部的“蛋白質(zhì)宇宙”。這一成果在很大程度上解決了傳統蛋白質(zhì)解析面臨的因人力資源和儀器資金高投入所面臨的效率問(wèn)題,為下游相關(guān)的生物制藥和醫療應用領(lǐng)域研發(fā)打開(kāi)了新的大門(mén)。蛋白質(zhì)解析領(lǐng)域的領(lǐng)軍人物施一公曾經(jīng)評價(jià)到,“AlphaFold蛋白質(zhì)解析是本世紀最重要的科學(xué)突破之一”。
2024年5月,AlphaFold3推出,在原有的卷積神經(jīng)網(wǎng)絡(luò )和增強學(xué)習技術(shù)上,AlphaFold3運用了大模型中廣泛運用的注意力機制加擴散算法。在不斷的迭代發(fā)展中,AlphaFold3已經(jīng)可以蛋白質(zhì)以外的幾乎所有的生物分子結構。
這意味著(zhù),這一技術(shù)可以更為廣泛地應用在生物學(xué)、高科技甚至是部分傳統的生產(chǎn)制造領(lǐng)域。從分子結構層面對于材料、配方和生產(chǎn)流程的進(jìn)一步理解,能夠極大拓寬這些領(lǐng)域的技術(shù)以及應用機會(huì ),而對于這樣技術(shù)的應用所帶來(lái)的知識變革,也將會(huì )對這些行業(yè)的競爭藍圖產(chǎn)生深刻甚至是顛覆性的影響。
未來(lái)之路
縱觀(guān)從AlphaGo到AlphaFold3的發(fā)展過(guò)程,我們看到的是過(guò)去9年間,從技術(shù)爆發(fā)到應用的迷茫,再到特定領(lǐng)域聚焦的探索,最后在不斷向外擴展的應用邊界中呈現出更為確定的通用潛力。這個(gè)歷程無(wú)疑驗證了比爾蓋茨的名言,“我們總是高估未來(lái)兩年內發(fā)生的變化,低估未來(lái)十年內發(fā)生的變化”。
面對ChatGPT和更為新興的大模型技術(shù),也許在不遠的未來(lái),我們仍會(huì )看到AlphaGo所經(jīng)歷過(guò)的風(fēng)口沉寂。盡管性能驚人,大模型的真正應用還要攻克技術(shù)、應用場(chǎng)景、商業(yè)模式等眾多挑戰。
首先,創(chuàng )新的商業(yè)化應用是高性能技術(shù)的成功組合,而不是單一技術(shù)的延展。目前,大模型基于表征關(guān)聯(lián)產(chǎn)生的幻覺(jué)問(wèn)題,也許需要輔助技術(shù)的加持,而不是單一在技術(shù)內尋求性能突破。如何通過(guò)技術(shù)的疊加和組合,讓大模型能夠更為有效地在預訓練的基礎上學(xué)習和理解世界,也許成為未來(lái)技術(shù)突破和從技術(shù)上競爭優(yōu)勢的關(guān)鍵之一。
第二,大模型本身性能的提升和商業(yè)化,也有賴(lài)于人工智能技術(shù)之外多維度的創(chuàng )新突破。技術(shù)的成功商業(yè)化離不開(kāi)與技術(shù)相匹配的配套資產(chǎn)的發(fā)展。尤其是大模型的Scaling Law,指數級極大參數疊加才能帶來(lái)語(yǔ)義理解性能的倍數提升,這使得當前人工智能的訓練和推理從本質(zhì)上就無(wú)法避免極大的算力消耗。如何能夠提高大模型的效率降低能耗,從算法上用更小的參數實(shí)現相同的性能,從數據上提高訓練效率。這些都是大模型進(jìn)一步發(fā)展亟待解決的問(wèn)題。
第三,大模型的不確定性還來(lái)自于人工智能基礎科研層面面臨的挑戰。縱觀(guān)美國信息技術(shù)以及其他高新技術(shù)的發(fā)展史,由政府資助、高校主導的基礎科研一直發(fā)揮著(zhù)至關(guān)重要的基礎知識生產(chǎn)、篩選和初步轉化的的職責。包括互聯(lián)網(wǎng)等當代至關(guān)重要的技術(shù)發(fā)明,最初都誕生于高??蒲?。但大模型的超高的算力需求以及相應的資本投入,已經(jīng)超出了目前美國學(xué)校的經(jīng)費承受能力,這使得人工智能領(lǐng)域的基礎科研向企業(yè)轉移——李飛飛和前谷歌首席科學(xué)家辛頓在2023年10月的一次對話(huà)訪(fǎng)談中如是說(shuō)。
在很大程度上,任何以單一應用導向的基礎研究都具有很高的風(fēng)險。在新興技術(shù)發(fā)展的早期,實(shí)現盡可能大的技術(shù)多樣性,才能夠保證最優(yōu)的創(chuàng )新組合在充分的技術(shù)競爭中得以留存,最終成為主導。企業(yè)以商業(yè)應用和利潤為導向的本質(zhì),有可能會(huì )導致其基礎科研過(guò)早偏于保守和單一,錯過(guò)更為激進(jìn)但有效的遠程技術(shù)機會(huì )。
中國的人工智能技術(shù)同樣面臨這樣的風(fēng)險。如何從高??蒲?、通過(guò)企業(yè)合作和政府支持的雙重模式,尋求多樣的技術(shù)可能性,或許能在一定程度上縮短AlphaGo由企業(yè)主導的技術(shù)探索期,成為未來(lái)人工智能技術(shù)更為快速破局的關(guān)鍵。
在應用層面,AlphaGo的發(fā)展歷程,對于我們理解人工智能的未來(lái),也具有啟示意義。新技術(shù)應用層面的成功商業(yè)化,起始于與技術(shù)特點(diǎn)和路徑最為適配的相關(guān)領(lǐng)域,隨著(zhù)應用的逐漸成熟,才會(huì )在這些領(lǐng)域的臨近區域尋求延展機會(huì ),最后在更為廣闊的層面延展泛化。
在人工智能的發(fā)展中,公眾熱情和投資所呈現的周期性,也源于技術(shù)早期的真實(shí)適用范圍與外界預期的錯配。而過(guò)早投資在應用領(lǐng)域,在新興技術(shù)性能無(wú)法適配的情況下強行尋求應用甚至人為制造風(fēng)口,并不能真正加速技術(shù)的成熟,反而會(huì )導致稀缺資源的浪費和錯配。
喧囂過(guò)后,對于挑戰的直面和努力,對于風(fēng)險下的契機識別和把握,對于制度的不斷完善和資源配置的悉心規劃,也許是當下實(shí)現從ChatGPT到通用人工智能蛻變的基礎和關(guān)鍵,讓這一備受關(guān)注的技術(shù),在更長(cháng)遠的未來(lái)真正賦能各個(gè)應用領(lǐng)域的產(chǎn)業(yè)升級和變革。
(作者系中歐國際工商學(xué)院管理學(xué)副教授)