抖快激戰人工智能
抖快悄然展開(kāi)著(zhù)一場(chǎng) AI 視頻大模型的新競爭。
作者:林志佳
來(lái)源:鈦媒體AGI(ID:TMTPOSTAGI)
備受關(guān)注的中國版Sora視頻模型快手可靈,即將迎來(lái)新的對手。
7月16日消息,鈦媒體AGI獲悉,字節跳動(dòng)團隊將會(huì )在7月19日(本周五)分享文生圖、類(lèi)sora新視頻等全新人工智能(AI)模型技術(shù)進(jìn)展,尤其在長(cháng)視頻、高動(dòng)態(tài)方向上具備創(chuàng )新技術(shù)。
早前,“字節跳動(dòng)開(kāi)源”*發(fā)布消息稱(chēng),其將在新加坡舉辦關(guān)于世界模型(World Models)探索的AI技術(shù)菁英論壇(ByteDance AI Luminary Talks)活動(dòng),字節跳動(dòng)研究科學(xué)家周大權將會(huì )圍繞“連續高動(dòng)態(tài)的長(cháng)視頻生成方案”展開(kāi)演講。
一位消息人士對鈦媒體App表示,字節跳動(dòng)內部將 AI 大模型設為集團P0最高級別的方向。另一位消息人士則指出,除了上述研究團隊之外,抖音、剪映等內部多個(gè)團隊也在研發(fā) AI 視頻模型應用,預計將在近期公布。
而與此同時(shí),國內唯二的短視頻龍頭快手在 AI 視頻大模型領(lǐng)域進(jìn)展迅速。繼6月6日快手13周年發(fā)布并邀測可靈模型應用之后,7月6日,快手在世界人工智能大會(huì )(WAIC 2024)期間開(kāi)源可圖文生圖大模型,以及免費上線(xiàn)可靈Web端。
快手透露,全球首個(gè)用戶(hù)可用的真實(shí)影像級視頻生成大模型可靈平臺申請用戶(hù)數超過(guò)50萬(wàn),開(kāi)通用戶(hù)數超過(guò)30萬(wàn),生成視頻數達700萬(wàn)以上。
這意味著(zhù),曾在互聯(lián)網(wǎng)短視頻平臺領(lǐng)域對戰的兩家中國公司抖快(抖音/字節跳動(dòng)、快手),如今則悄然展開(kāi)著(zhù)一場(chǎng)圍繞中國領(lǐng)先 AI 視頻大模型的新競爭。
01
中國兩大短視頻巨頭轉向人工智能
實(shí)際上,AI 是短視頻平臺中關(guān)系最為密切的底層技術(shù)。
“只有短視頻平臺業(yè)務(wù),在沒(méi)有機器學(xué)習的時(shí)候是不成立的。大家想象一下,大部分用戶(hù)是不會(huì )因為一、兩個(gè)你記得的短視頻去打開(kāi)一個(gè)APP的,打開(kāi)APP一定是相當長(cháng)一段時(shí)間的沉浸式體驗,能帶給非常多收獲的感覺(jué)。所以,AI是(快手)業(yè)務(wù)的核心,沒(méi)有AI技術(shù),這個(gè)業(yè)務(wù)是不成立的。”快手高級副總裁、快手主站業(yè)務(wù)與社區科學(xué)負責人蓋坤(快手于越)表示,相比電商、搜索等場(chǎng)景,短視頻更需要 AI 技術(shù)加持。
而有趣的是,負責 AI 產(chǎn)品的蓋坤曾在字節任職過(guò)。
實(shí)際上,過(guò)去10余年中國移動(dòng)互聯(lián)網(wǎng)時(shí)期下,從桌面、瀏覽器,到輸入法、天氣軟件,都在尋找能夠占領(lǐng)用戶(hù)心智的下一個(gè)“*”。然而,最終我們發(fā)現,能夠與*相提并論的產(chǎn)品是兩款短視頻直播產(chǎn)品——抖音和快手,當然這背后有5G、疫情等因素,但抖快確實(shí)已經(jīng)成為國民應用級別產(chǎn)品,抖音日活用戶(hù)超過(guò)6億,快手日活用戶(hù)則已經(jīng)達到3.94億(2024年Q1)。
2024年2月,繼ChatGPT之后,OpenAI公布的Sora AI視頻生成模型再度引爆全網(wǎng),通過(guò)簡(jiǎn)短或詳細的提示詞描述,或一張靜態(tài)圖片,Sora就能生成類(lèi)似電影的逼真場(chǎng)景,涵蓋多個(gè)角色、不同類(lèi)型動(dòng)作和背景細節等,最高能生成1分鐘左右的1080P高清視頻。
“Sora是能夠理解和模擬現實(shí)世界的模型的基礎,我們相信這一功能將成為實(shí)現通用人工智能(AGI)的重要里程碑。”OpenAI指出,Sora不只是視頻生成模型,而是“世界模擬器”。
自今年5月起,達到類(lèi)Sora級別的國內 AI 視頻生成模型陸續公布,包括生數、智象未來(lái)(HiDream.ai)等。而就在6月6日,快手可靈 AI 視頻生成模型開(kāi)啟邀測,整個(gè)生成效果直逼Sora,引發(fā)關(guān)注。
蓋坤指出,快手的 AI 技術(shù)主要在短視頻內容推薦、內容生產(chǎn)和內容理解三個(gè)層面進(jìn)行應用布局,大模型時(shí)代落地的則是快手快意語(yǔ)言大模型、十萬(wàn)億參數規模的推薦模型SIM、5月公布的可圖文生圖模型、6月發(fā)布的可靈 AI 視頻模型等技術(shù)。
不僅是技術(shù),快手也在商業(yè)化層面進(jìn)行布局。蓋坤表示,基于快意大模型構建的視頻和直播腳本生成、廣告搜索客服疊加數字人技術(shù),使得AIGC日均消耗增長(cháng)達到2000萬(wàn)。
相比于快手,由于企業(yè)暫未上市,導致抖音和字節跳動(dòng)對于 AI 大模型的布局略顯神秘。
過(guò)去一年多,隨著(zhù) AI 大模型浪潮席卷國內外,字節跳動(dòng)全面追趕,并對AI大模型進(jìn)行模型層到應用層的全面布局。
其中,在基礎大模型領(lǐng)域,2023年8月,該公司上線(xiàn)首個(gè)大語(yǔ)言模型“豆包”及多模態(tài)大模型BuboGPT。其抖音云雀大模型通過(guò)首批《生成式人工智能服務(wù)管理暫行辦法》備案,面向公眾開(kāi)放。同時(shí),字節跳動(dòng)基礎模型在語(yǔ)言和圖像兩種模態(tài)上均進(jìn)行了布局,兩個(gè)團隊均向TikTok技術(shù)負責人朱文佳匯報。
在A(yíng)I應用層,字節跳動(dòng)已于去年11月成立新AI部門(mén)Flow,目前已推出三款AI對話(huà)類(lèi)產(chǎn)品,包括豆包、扣子和Cici。其中,豆包為一款聊天機器人產(chǎn)品,可以完成問(wèn)答、文本生成、語(yǔ)言翻譯等多種任務(wù),還可以根據用戶(hù)需求和上下文進(jìn)行自適應問(wèn)答,提供個(gè)性化服務(wù)。扣子是一站式AI Bot開(kāi)發(fā)平臺,無(wú)論用戶(hù)是否有編程基礎,都可以在扣子平臺上快速搭建基于A(yíng)I模型的各類(lèi)問(wèn)答Bot,可完成解決簡(jiǎn)單的問(wèn)答,并處理復雜邏輯的對話(huà)。
進(jìn)入2024年,字節跳動(dòng)加大產(chǎn)品研發(fā)速度,持續推出AI學(xué)習伙伴河馬愛(ài)學(xué)、AI劇情互動(dòng)產(chǎn)品貓箱、AI生圖產(chǎn)品PicPci、多模態(tài)數字人產(chǎn)品以及AI生圖、AI生視頻產(chǎn)品等多款AI大模型領(lǐng)域產(chǎn)品。
同時(shí),最新消息顯示,字節跳動(dòng)還在圍繞AI硬件進(jìn)行布局。其中一條產(chǎn)品線(xiàn)聚焦可穿戴AI設備,以剛剛被字節跳動(dòng)收購的耳機品牌Oladance團隊為基礎進(jìn)行探索;另一條產(chǎn)品線(xiàn)負責探索手持類(lèi)AI設備,更接近對現有主流計算設備的AI化延展,成立更早,與AI應用團隊Flow也更緊密。而且,字節跳動(dòng)旗下剪映也在研發(fā)AI產(chǎn)品,名為即夢(mèng)。
字節已布局的 AI 領(lǐng)域相關(guān)技術(shù)和產(chǎn)品
對于 AI 算力底層,之前字節跳動(dòng)旗下火山引擎首次發(fā)布了自研的視頻編解碼芯片。字節跳動(dòng)副總裁楊震原曾透露,公司無(wú)通用芯片商業(yè)計劃,沒(méi)有涉足CPU、GPU等通用芯片業(yè)務(wù)。
因此,整體來(lái)說(shuō),抖音/字節跳動(dòng)和快手從底層研發(fā),到產(chǎn)品和商業(yè)化層面都在布局 AI 大模型技術(shù),希望在 AI 時(shí)代下?lián)尩孟葯C。但是,截至目前,暫未出現抖音利用 AI 大模型實(shí)現商業(yè)化的更多信息釋出。
02
場(chǎng)景難通用用 AI 賺錢(qián)的時(shí)代才剛剛開(kāi)始
“過(guò)去一年,全行業(yè)都繼續投入到生成式AI和大模型熱潮當中,每家企業(yè)都在努力思考如何將 AI 融入業(yè)務(wù),都深信 AI 將會(huì )成為未來(lái)技術(shù)創(chuàng )新和商業(yè)模式變革的核心,甚至有望帶來(lái)比互聯(lián)網(wǎng)更大的影響。但結果是,英偉達成為全球市值最高的公司,而期盼的 To C端 AI 殺手級原生應用遲遲沒(méi)有出現。”
“亂翻書(shū)”主理人潘亂的這句話(huà),打中了當下大模型熱潮背后的隱憂(yōu)與真實(shí)情況。
創(chuàng )新工場(chǎng)吉印通創(chuàng )始人汪華曾做過(guò)一個(gè)統計,中國實(shí)際上處于美國上半年第一階段的應用爆發(fā)前期。雖然最近大家看到很多產(chǎn)品在大量推廣,用戶(hù)量也在迅速增長(cháng),但是把所有應用加在一起,日活也不過(guò)就是 1000 萬(wàn),中國有 12 億網(wǎng)民;而美國 3 億人口就有大幾千萬(wàn)的日活,相比之下還有很大的差距。
這說(shuō)明,雖然 AI 未來(lái)已來(lái),但是模型的產(chǎn)品化還遠遠沒(méi)有到來(lái),甚至可以說(shuō)是模型應用落地才剛剛開(kāi)始。
“大家還是太焦慮了,大模型從開(kāi)始到現在才一年多時(shí)間,整個(gè)的應用發(fā)展,本質(zhì)上還是要隨著(zhù)模型的成熟和整個(gè)應用生態(tài)的構建逐漸發(fā)展。”汪華認為,ChatGPT 作為通用工具,用戶(hù)平均時(shí)長(cháng)是七八分鐘,但我看過(guò)很多做社交娛樂(lè )的創(chuàng )業(yè)公司,他們的平均使用時(shí)長(cháng)超過(guò) 150 分鐘。推理成本只要降 10 倍,工具類(lèi)的應用就可以做大體量免費。推理成本降得更低,高時(shí)長(cháng)娛樂(lè )性的應用才能做到大體量免費,所以大用戶(hù)量的工具,我覺(jué)得今年年底到明年年初就會(huì )實(shí)現。再往后是衣食住行,這類(lèi)應用需要更高的模型性能,以及商業(yè)模式整合,從吃喝玩樂(lè )到衣食住行,這個(gè)時(shí)間周期大約在 3-4 年之內走完。
而作為抖音和快手這種短視頻龍頭來(lái)說(shuō),將 AI 技術(shù)“隨風(fēng)潛入夜,潤物細無(wú)聲”實(shí)現落地,這可能他們想要達到的終極目的。
多位 AI 領(lǐng)域從業(yè)者向鈦媒體App坦言,目前 AI 大模型技術(shù)更像是“文科生”,很難理解數學(xué)問(wèn)題,所以其應用場(chǎng)景的范圍非常有限,當前模型的最大作用是提升效率的“生產(chǎn)力工具”。
很顯然,用 AI 賺錢(qián)的時(shí)代才剛剛開(kāi)始。
據麥肯錫最新發(fā)布的一份全球調查報告稱(chēng),65%的受訪(fǎng)者表示企業(yè)會(huì )經(jīng)常使用生成式AI。這比10個(gè)月前的調查(33%)幾乎翻了一番。其中,服務(wù)業(yè)對于 AI 技術(shù)的使用率增幅最大。
同時(shí),四分之三(75%)的受訪(fǎng)者預測,生成式 AI 將在未來(lái)幾年內為其行業(yè)帶來(lái)重大或顛覆性的變化。
有熟悉字節的消息人士曾告訴鈦媒體App,字節跳動(dòng)內部對于 AI 模型的技術(shù)應用布局非常廣泛,且存在一定的內部“優(yōu)勝劣汰”競爭策略,多個(gè)團隊加緊比拼當中。
蓋坤則表示,快手希望堅定為用戶(hù)做最好的 AI 技術(shù)。
MiniMax創(chuàng )始人、CEO閆俊杰曾對鈦媒體App表示,今年上半年,公司開(kāi)始意識到,在一些偏生產(chǎn)力的場(chǎng)景里,“我們開(kāi)始具備局部?jì)?yōu)勢了”。至少三年后,國內才有可能出現“殺手級”AI應用。預計MiniMax首款 AI 視頻應用將最快于8月推出。
“坦白講,我覺(jué)得大部分(國內)公司都還沒(méi)有拉開(kāi)差異化,大家都差不多,可能模型水平也差不多,產(chǎn)品也差不多,然后就會(huì )開(kāi)始‘拼價(jià)格’。我覺(jué)得這個(gè)東西不是壞事,其實(shí)是逼著(zhù)大家能夠更好來(lái)做技術(shù)創(chuàng )新。”閆俊杰表示。
7張PPT,揭秘華為的“人工智能路線(xiàn)圖”
*免責聲明:本文章為作者獨立觀(guān)點(diǎn),不代表i黑馬立場(chǎng)。
加入科技交流群
加入“AI應用伙伴計劃”
成為 AI 產(chǎn)業(yè)新力量
立即報名
聯(lián)系我們
轉載開(kāi)白或商務(wù)合作:15222191516
與主編交流溝通:chenfu3721
i黑馬,創(chuàng )業(yè)黑馬旗下媒體,讓創(chuàng )業(yè)者不再孤獨。