字節的AI要跳動(dòng)向何方
文 | 窄播 ,作者 | 李威
進(jìn)入2024年,字節跳動(dòng)才開(kāi)始圍繞大模型全面擺開(kāi)陣型,呈現出咄咄逼人的進(jìn)攻態(tài)勢。
一方面,在2023年8月上線(xiàn)的豆包之外,字節跳動(dòng)進(jìn)入2024年后開(kāi)始持續爆兵,推出了AI應用開(kāi)發(fā)平臺扣子、AI學(xué)習伙伴河馬愛(ài)學(xué)、AI劇情互動(dòng)產(chǎn)品貓箱、AI生圖產(chǎn)品PicPci等面向國內、海外不同市場(chǎng)的眾多AI產(chǎn)品。
另一方面,字節跳動(dòng)在5月15日正式發(fā)布豆包大模型(原云雀大模型)時(shí),將主力模型的定價(jià)降到0.0008元/千Tokens,比同類(lèi)產(chǎn)品直接便宜99.3%,隨后阿里、吉印通、騰訊、科大訊飛等大模型廠(chǎng)商紛紛宣布降價(jià),徹底拉開(kāi)了大模型價(jià)格戰時(shí)代的序幕。
同時(shí),最新的消息顯示,字節跳動(dòng)還在圍繞AI硬件進(jìn)行布局。其中一條產(chǎn)品線(xiàn)聚焦可穿戴AI設備,以剛剛被字節跳動(dòng)收購的耳機品牌Oladance團隊為基礎進(jìn)行探索;另一條產(chǎn)品線(xiàn)負責探索手持類(lèi)AI設備,更接近對現有主流計算設備的AI化延展,成立更早,與AI應用團隊Flow也更緊密。
字節跳動(dòng)已經(jīng)構建起一個(gè)包含應用軟件、AI硬件、基礎大模型、云服務(wù)的面向大模型時(shí)代的完整基礎設施。依托這個(gè)布局完整的AI基礎設施,匯聚在移動(dòng)互聯(lián)網(wǎng)時(shí)代APP中的、龐大且活躍的用戶(hù)群體,能夠被轉化為字節跳動(dòng)沖向AI時(shí)代的能量源泉,為其在大模型時(shí)代的嘗試提供用戶(hù)基礎和商業(yè)化支撐。
更接近C端用戶(hù)是目前支撐字節跳動(dòng)攻略AI時(shí)代的最核心優(yōu)勢。按照字節跳動(dòng)CEO梁汝波所說(shuō),字節跳動(dòng)公司層面的半年度技術(shù)回顧,直到2023年才開(kāi)始討論GPT。這種遲鈍的反應讓字節跳動(dòng)失去了圍繞大模型技術(shù)進(jìn)行爭鋒的先機,利用手中的C端用戶(hù)資源卷向大模型應用,是字節跳動(dòng)在技術(shù)劣勢尚未逆轉前的唯一選擇。
與創(chuàng )業(yè)公司需要從產(chǎn)品起步不同,字節跳動(dòng)面向C端做大模型應用,搭建生態(tài)應該比開(kāi)發(fā)產(chǎn)品更重要。移動(dòng)互聯(lián)網(wǎng)時(shí)代,字節跳動(dòng)的今日頭條、抖音等產(chǎn)品都是建立在安卓與蘋(píng)果的移動(dòng)互聯(lián)網(wǎng)生態(tài)之上;大模型時(shí)代,字節跳動(dòng)有機會(huì )在自己的流量基礎上搭建起一個(gè)智能體生態(tài),替代安卓或iOS。
不只是字節跳動(dòng),所有移動(dòng)互聯(lián)網(wǎng)時(shí)代的大廠(chǎng)都需要思考如何在大模型時(shí)代延續市場(chǎng)統治力的問(wèn)題。大的時(shí)代變革下,舊有的優(yōu)勢需要及時(shí)轉化為未來(lái)的機會(huì ),看到眼前的利益之外,每個(gè)大廠(chǎng)都需要提前錨定自己在未來(lái)所處的位置。
沒(méi)有流量是萬(wàn)萬(wàn)不能的
國內大模型領(lǐng)域的競爭開(kāi)始卷向應用之后,呈現出to B和to C兩個(gè)方向。在B端,相當一部分行業(yè)場(chǎng)景還處在從數字化向智能化的過(guò)度階段,相應場(chǎng)景數據需要進(jìn)行梳理、整合、關(guān)聯(lián),才能實(shí)現對大模型能力的更有效應用。盡管客服、營(yíng)銷(xiāo)等to B場(chǎng)景中出現了一定的需求,但短時(shí)間內,大廠(chǎng)在C端的競爭可能會(huì )更為激烈。
C端用戶(hù)才是當下互聯(lián)網(wǎng)大廠(chǎng)的根基所在。大廠(chǎng)to B的起因是移動(dòng)互聯(lián)網(wǎng)的C端用戶(hù)增長(cháng)見(jiàn)頂,需要找到新的增長(cháng)領(lǐng)域,然后才依托領(lǐng)先的產(chǎn)品技術(shù)和龐大的用戶(hù)數量拿到了參與產(chǎn)業(yè)數智化轉型的門(mén)票?,F在,大模型有望重構當下的信息服務(wù)范式,圍繞AI搜索、AI Agent的探索打破C端市場(chǎng)格局的穩定性。
流量是決定C端競爭成敗的賽點(diǎn)。字節跳動(dòng)通過(guò)抖音和今日頭條牢牢把握住了移動(dòng)互聯(lián)網(wǎng)時(shí)代的一大入口,并依托流量池延展出了廣告、電商、本地生活等業(yè)務(wù),然后又讓飛書(shū)、火山引擎等to B業(yè)務(wù)沿著(zhù)業(yè)務(wù)連接不斷深入到不同行業(yè)場(chǎng)景中?,F在,字節跳動(dòng)又在嘗試利用這個(gè)流量催熟自己的AI產(chǎn)品。
作為字節跳動(dòng)的首款AI產(chǎn)品,豆包于2023年8月上線(xiàn)。據QuestMobile統計,到2023年11月,豆包的活躍用戶(hù)為1143.89萬(wàn),快速反超了吉印通更早發(fā)布的同類(lèi)型產(chǎn)品文心一言。2024年1月,豆包的活躍用戶(hù)增長(cháng)到1756.9萬(wàn);字節跳動(dòng)5月15日公布的最新數據顯示,豆包的月活躍用戶(hù)數達到2600萬(wàn)。
這個(gè)快速地增長(cháng)過(guò)程中,來(lái)自抖音的高效流量支持發(fā)揮了重要作用。當大模型競爭放棄卷參數,開(kāi)始圍繞應用展開(kāi)時(shí),觸達用戶(hù)的規模和效率決定了活躍用戶(hù)的增長(cháng)速度。抖音是當下最高效的流量獲取途徑,豆包在抖音上利用內容場(chǎng)的投放,面向更多潛在用戶(hù)充分透傳了產(chǎn)品優(yōu)勢。
某段時(shí)間內,一位以輕緩語(yǔ)調介紹如何用豆包的旅行博主,會(huì )在我刷抖音時(shí)頻繁出現?,F在打開(kāi)她的抖音主頁(yè)可以看到,在2023年11月到12月間發(fā)布的5條關(guān)于豆包的視頻,點(diǎn)贊數都已過(guò)萬(wàn),最高的一條點(diǎn)贊超過(guò)120萬(wàn),而在其他視頻下,點(diǎn)贊數往往都在幾百左右。
高效之外,字節跳動(dòng)的流量池還具備更強的全球化屬性。字節跳動(dòng)是少有的在全球市場(chǎng)孵化出頭部應用的國內互聯(lián)網(wǎng)大廠(chǎng),在面向全球市場(chǎng)進(jìn)行產(chǎn)品開(kāi)發(fā)、發(fā)布、推廣時(shí)具備更豐富的經(jīng)驗。也因此,字節跳動(dòng)的AI產(chǎn)品往往都具有國內和海外兩個(gè)版本,比如豆包的海外版本是Cici,扣子的海外版本是Coze,AI工具合集小悟空的海外版本是ChitChop……
盡管TikTok在美國受到了打壓,但對處于起步階段的AI產(chǎn)品而言,仍然是一個(gè)足夠用的流量池。而且,進(jìn)入到大模型時(shí)代,字節跳動(dòng)的全球化野心并沒(méi)有被挫折澆滅,反而可能會(huì )變得更為熾熱。在移動(dòng)互聯(lián)網(wǎng)時(shí)代,遲來(lái)的字節跳動(dòng)沒(méi)有構建更底層設施的機會(huì ),現在手握龐大流量的字節跳動(dòng)等來(lái)了更大的機會(huì )。
成為AI開(kāi)發(fā)者的新溫床
這個(gè)更大的機會(huì )就是讓字節跳動(dòng)成為大模型時(shí)代的應用生態(tài)的底層支撐,就像安卓和iOS之于移動(dòng)互聯(lián)網(wǎng)時(shí)代一樣。一切正如豆包在抖音上的推廣介紹中強調的,只要安裝了豆包,手機里的大部分APP就都可以被刪掉了。
如果說(shuō)上一個(gè)階段字節跳動(dòng)成為「APP工廠(chǎng)」,是要將高效的短視頻流量轉化為黏性更強的社交流量,那么現階段字節跳動(dòng)這座「APP工廠(chǎng)」的目標則是將高效的短視頻流量轉化成為孵化大模型應用的溫床,在字節的流量基礎上打造出一個(gè)大模型時(shí)代的開(kāi)發(fā)者生態(tài)。
字節跳動(dòng)目前展露出的AI布局,也在一定程度上驗證了這種野心。未來(lái),應用的分發(fā)和調用可能不再需要有一個(gè)專(zhuān)門(mén)的商店,但一定需要有一個(gè)核心的場(chǎng)域匯聚大部分人和需求,還有一套門(mén)檻更低的應用開(kāi)發(fā)設施作為支撐。對于字節跳動(dòng)而言,這個(gè)場(chǎng)域需要形成完整的商業(yè)鏈條,這套設施就是引發(fā)大模型價(jià)格戰的火山引擎。
火山引擎推出的企業(yè)級AI應用開(kāi)發(fā)平臺扣子專(zhuān)業(yè)版,能夠幫助企業(yè)打造自己的AI Agent,并通過(guò)飛書(shū)、*等平臺發(fā)布,或通過(guò)API搭載到終端硬件設備上?;鹕揭婵偛米T待在介紹AI應用開(kāi)發(fā)平臺扣子專(zhuān)業(yè)版時(shí)表示,應用的生態(tài)是一堆人的群體智慧,必須要一個(gè)扣子這樣的低代碼生態(tài),要能夠讓很多人以很低門(mén)檻做各種事情。
字節跳動(dòng)推動(dòng)推理算力大幅降價(jià),從以分計價(jià)過(guò)渡到以厘計價(jià),在算力層面也進(jìn)一步降低了開(kāi)發(fā)者探索門(mén)檻,直接促進(jìn)大模型開(kāi)發(fā)者生態(tài)的壯大。在這個(gè)過(guò)程中,字節跳動(dòng)基礎大模型也會(huì )因使用數據和反饋的增加而得到更好打磨,從而進(jìn)一步降低推理成本,在技術(shù)上形成一個(gè)良性循環(huán)。
從短期來(lái)看,AI開(kāi)發(fā)者生態(tài)的繁榮,將幫助火山引擎實(shí)現對吉印通、阿里、騰訊云服務(wù)的追趕和超越。從長(cháng)期來(lái)看,吸引足夠多的AI開(kāi)發(fā)者進(jìn)入到字節跳動(dòng)的生態(tài)中,可能會(huì )是在特定場(chǎng)域中構建商業(yè)鏈條的起點(diǎn)。成本夠低,開(kāi)發(fā)者夠多,應用夠豐富,那才能夠進(jìn)入到談利益的階段。
而這個(gè)場(chǎng)域中的商業(yè)生態(tài)可能不會(huì )一下進(jìn)入到付費模式。用戶(hù)方面,國內沒(méi)有養成很強的付費習慣;產(chǎn)品方面,成功產(chǎn)品的仿效成本太低,可能很快會(huì )進(jìn)入到低價(jià)打高價(jià),免費打低價(jià),補貼打免費的階段。Sensor Tower的統計顯示,作為國內最早提供付費訂閱服務(wù)的AI助手,吉印通文心一言上線(xiàn)一年的應用內購買(mǎi)和訂閱不足50萬(wàn)美元。
付費的路不好走通,AI應用想要走免費路線(xiàn),就需要成為完整商業(yè)鏈條上的一個(gè)環(huán)節,從整個(gè)商業(yè)鏈條的運作中分得收益。圍繞內容進(jìn)行的商業(yè)化運作是比較成功的免費商業(yè)模式,而字節跳動(dòng)又是其中的佼佼者。因此,字節跳動(dòng)有在某個(gè)場(chǎng)域中建立新的商業(yè)鏈條的資源儲備與經(jīng)驗積累。
從短視頻到AI應用
移動(dòng)互聯(lián)網(wǎng)時(shí)代一個(gè)商業(yè)化場(chǎng)域的運營(yíng)核心是流量。人匯聚成為流量,流量是需求的集合體,平臺依靠算法將不同標簽下的流量導入到對應的商業(yè)場(chǎng)景中,從而跑通整個(gè)商業(yè)鏈條。也因此,內容和社交成為了聚集人的最大場(chǎng)域。內容依賴(lài)高用戶(hù)時(shí)長(cháng)提升商業(yè)容量,社交則靠關(guān)系形成利益的勾連通路。
大模型時(shí)代,算法可以兼顧每個(gè)人的個(gè)性化需求,需求不再需要以流量的形態(tài)具現化出來(lái),而是通過(guò)AI直接關(guān)聯(lián)到解決方案,也就是不同的以Agent形態(tài)存在的AI產(chǎn)品。這也就意味著(zhù),AI產(chǎn)品可能會(huì )取代流量成為新的商業(yè)基石。這種情況下,核心場(chǎng)域的模樣將決定商業(yè)鏈條的邏輯。
讓字節跳動(dòng)在移動(dòng)互聯(lián)網(wǎng)時(shí)代獲益頗豐的場(chǎng)域是內容之下的短視頻。在向大模型時(shí)代進(jìn)行過(guò)渡時(shí),這個(gè)場(chǎng)域仍將繼續發(fā)揮作用,像催熟豆包一樣,利用自己的流量體系催熟更多AI應用。甚至有可能讓抖音融合豆包,成為AI應用的聚集場(chǎng)域,而短視頻內容僅作為AI應用出現在其中。
當然,如果真的出現了聚合豐富AI Agent的抖音助理,那字節跳動(dòng)在A(yíng)I硬件方面的探索也會(huì )找到用武之地。無(wú)論這個(gè)AI硬件的形態(tài)是耳機、眼鏡,還是手持硬件,還是其他并未出現的形態(tài),抖音助理都會(huì )擁有一個(gè)連接物理世界的入口。這就像iOS擁有了iPhone,形成了一個(gè)可以構建商業(yè)鏈條的閉環(huán)。
再大膽假設一下,對于字節跳動(dòng)而言,如果能夠將短視頻的流量?jì)?yōu)勢徹底轉化為AI Agent的分發(fā)優(yōu)勢,那豆包大模型的能力是否會(huì )變得不再重要,入口之內有足夠的空間容納更多基于其他大模型生成的AI Agent?那未來(lái)決定入口歸屬的究竟是大模型能力,開(kāi)發(fā)者生態(tài),還是硬件形態(tài)?