當前位置:首頁(yè) > 百科 > 正文內容

一次性生成5個(gè)8秒視頻,用AI做抖音短視頻不是夢(mèng)?|AI新榜

嘉峪關(guān)拼版印刷3個(gè)月前 (07-31)百科9
印刷廠(chǎng)直印●彩頁(yè)1000張只需要69元●名片5元每盒-更多報價(jià)?聯(lián)系電話(huà):138-1621-1622(微信同號)

最近的AI視頻賽道,在玩法上“卷”出了新高度。

有用戶(hù)用它完善視頻細節:

還有人用它創(chuàng )作了科幻大片:

甚至讓馬斯克微笑點(diǎn)頭:

還有大魚(yú)吃小魚(yú),實(shí)現普通攝像頭難以拍攝的效果:

較強的靈活性和視頻可控性,一下讓人難以分辨虛實(shí),而這些鏡頭都是靠愛(ài)詩(shī)科技的AI視頻工具PixVerse實(shí)現的。

PixVerse繼4月更新運動(dòng)筆刷功能之后,今日又重磅上線(xiàn)了PixVerse V2模型。V2支持直接生成長(cháng)達8秒的視頻,甚至可以一次性生成1-5個(gè)視頻片段,并保證風(fēng)格、主體和場(chǎng)景的一致性。

PixVerse已經(jīng)率先朝著(zhù)AI視頻生成的一致性方向發(fā)力。這是要進(jìn)軍AIGC短片嗎?此次更新的PixVerse V2實(shí)力究竟如何?“AI新榜”從角色一致性、想象力、控制力維度上,第一時(shí)間給各位玩家實(shí)測了一番。

實(shí)測PixVerse新功能:一次性生成5個(gè)8秒視頻

據了解,PixVerse突破了時(shí)長(cháng)技術(shù)限制,能單次生成8秒的視頻。但要知道AI視頻生成的時(shí)長(cháng)越長(cháng)越容易“露怯”,出現瑕疵。那么,其文本理解能力還能穩定發(fā)揮嗎?我們先用V2簡(jiǎn)單測了一下文生視頻和圖生視頻。

文生視頻

?提示詞:golden retriever in sunglasses sunbathing on a beach in Hawaii

PixVerse V2版本

PixVerse V1版本

從生成效果來(lái)看,動(dòng)物類(lèi)的表現很不錯,幾秒內可以動(dòng)的細節更多,比如狗狗的耳朵,毛發(fā)。雖然動(dòng)作幅度依舊比較小,但整體視頻呈現得更完整,在視頻質(zhì)量以及清晰度上都有明顯的進(jìn)步。

另外,PixVerse V2升級了模型理解和表達能力,在真實(shí)性和細節表達吉印通一步加強。

提示詞:A beautiful women is walking towards the camera

PixVerse V2版本

PixVerse V1版本

可以看到,人物類(lèi)鏡頭方面,畫(huà)面主體沒(méi)有出現特別大的技術(shù)瑕疵,光影效果也做得很好。相比前一個(gè)版本,V2生成的人物動(dòng)作幅度更大,也更真實(shí)。

但遺憾的是,和其他的AI視頻工具一樣,仍然是無(wú)法理解提示詞當中的鏡頭術(shù)語(yǔ),如“走向鏡頭”,畫(huà)面中主體的運動(dòng)只是簡(jiǎn)單轉了下頭。

圖生視頻

圖生視頻怎么能少得了這張經(jīng)典梗圖:

在圖生視頻模式下,我們沒(méi)有輸入任何提示詞,想看看PixVerse V2的“聯(lián)想”能力如何。

PixVerse V2并沒(méi)有讓圖中男生變成“渣男”,而是轉過(guò)頭與紅衣女孩錯過(guò),看多了其他AI視頻工具的戲劇效果,PixVerse V2展現的反而有點(diǎn)淡淡的憂(yōu)傷。

三個(gè)人的動(dòng)作幅度都不大,但難能可貴的是唯一出現臉部的紅衣女孩沒(méi)有出現“變臉”,犧牲了戲劇效果但保證了角色的一致性。

相比之下,這張“房子著(zhù)火我微笑”的梗圖生成效果就比較一般了。

轉頭離去,但“變臉”速度巨快:

控制住了變臉,但場(chǎng)景突然切換:

要說(shuō)整活,還是AI在行啊。但總的來(lái)說(shuō),圖生視頻參考了我們上傳的圖片元素,玩梗能力在線(xiàn),做二創(chuàng )是個(gè)不錯的選擇。

在此前“AI新榜”的短片嘗試,以及大量用戶(hù)反饋和社區討論反饋中,AI視頻的一致性一直是一個(gè)難題,更不用說(shuō)單次生成長(cháng)達40秒的視頻片段了,一起看看PixVerse V2的多片段生成能力。

生成多片段40秒視頻

在PixVerse首頁(yè)點(diǎn)擊右側“PixVerse V2”,就可以進(jìn)入多片段生成頁(yè)面,同樣支持文生和圖生視頻。

在這里,需要我們選擇“Scene 1”,輸入相應提示詞,再添加“Scene 2”,輸入第二個(gè)場(chǎng)景想要呈現的畫(huà)面,以此類(lèi)推,最多添加5個(gè)不同的場(chǎng)景后,一次性生成完整片段。

換句話(huà)說(shuō),就是把短片的視頻分鏡,通過(guò)自然語(yǔ)言的形式呈現出來(lái)。

從官網(wǎng)發(fā)布的信息看,在PixVerse V2模式下,5個(gè)場(chǎng)景的畫(huà)面風(fēng)格都會(huì )與第一個(gè)場(chǎng)景保持一致。

如果我們還上傳了圖片,那么這些圖片會(huì )參考場(chǎng)景1的圖片風(fēng)格進(jìn)行重繪,保證生成視頻風(fēng)格的一致性。

比如,我們輸入的提示詞如下:

Scene 1:the panda is playing the violin.

Scene 2:It is playing the piano.

Scene 3:It is eating the hamburger.

大約等待5分鐘左右,V2一次性生成了長(cháng)達16秒的視頻片段。可以看到,在視頻主體、場(chǎng)景以及畫(huà)面色調上盡量保持了一致性,還省去了我們單個(gè)片段不斷“抽卡”的時(shí)間。

,時(shí)長(cháng)

00:16

只不過(guò),最終生成的畫(huà)面在精細度上還有待提高,依舊會(huì )出現小提琴、漢堡微變形的畫(huà)面瑕疵。

如果我們對某個(gè)片段熊貓的動(dòng)作、環(huán)境、鏡頭運動(dòng)不滿(mǎn)意,還可以選擇替換相應的角色元素,進(jìn)行二次編輯。

我們繼續嘗試一下人物類(lèi)鏡頭一致性,將上述提示詞中的“panda”換成了“the woman”,測試了一波V2的角色控制能力。

沒(méi)想到的是,PixVerse V2直接規避了短板,生成了全是近景特寫(xiě)的片段,壓根沒(méi)出現人物。

,時(shí)長(cháng)

00:16

考慮到是“the woman”太過(guò)寬泛,我們又將主體替換成確切的人物角色“Harry Potter”,測試結果顯示,在多片段生成時(shí),人物手指等細節瑕疵無(wú)可避免,但場(chǎng)景、風(fēng)格一致性上發(fā)揮穩定。

1秒只需0.1元,AI視頻的成本競賽

今年下半年,AI視頻領(lǐng)域掀起了一波應用間的較量,快手可靈、Runway Gen-3等陸續面向公眾開(kāi)放使用。

幾家產(chǎn)品的問(wèn)世,都向我們傳遞了一個(gè)信息“AI視頻生成技術(shù)更適合短視頻制作”。

除了效果表現之外,陸續有AI工具開(kāi)始采取付費訂閱制,快手可靈同樣結束了免費試用期,正式邁入了“收費時(shí)代”。

快影App內公告

作為AI領(lǐng)域向來(lái)繞不開(kāi)的問(wèn)題,商業(yè)化的困境同樣出現在了視頻應用上。

當生成越長(cháng)的視頻,是否成本就越貴?

據調查機構Factorial Funds發(fā)文表示, Sora約30億參數的訓練成本,比1.8萬(wàn)億參數的GPT-4還要多。

Factorial Funds對Sora的相關(guān)報道

對于A(yíng)I視頻而言,一些生成服務(wù)會(huì )根據視頻的時(shí)長(cháng)、所需處理的視頻復雜性以及使用技術(shù)等因素來(lái)定價(jià)。

如果AI視頻還包括了高度定制化的內容,對視頻生成的質(zhì)量、連貫程度以及真實(shí)性有要求,實(shí)際所用的推理成本自然就會(huì )更高。

曾有媒體報道,國內AI企業(yè)做過(guò)一個(gè)估算,大約兩分鐘的AI視頻實(shí)際要花掉180元。

盈利,是擺在所有AI視頻工具面前的共同問(wèn)題。哪怕是PixVerse也扛不住相應的推理成本。

目前,PixVerse推出了訂閱套餐方案,基礎會(huì )員每月5美元,可以獲得1150個(gè)積分。

PixVerse每生成8秒的視頻,需要消耗30個(gè)積分,這樣算來(lái),1150個(gè)積分大約能生成20條完整的15秒短視頻,一條短視頻的成本折合人民幣1.5元,是Runway Gen-3費用的1/3。

當然,背后的技術(shù)以及生成視頻結果的不確定性,導致實(shí)際使用的成本會(huì )驟升。

費用之外,對于大多數普通用戶(hù)而言,短短幾秒的視頻時(shí)間,如果只是簡(jiǎn)單的鏡頭移動(dòng),除了獲得體驗感,很難有真正的使用場(chǎng)景。

愛(ài)詩(shī)科技創(chuàng )始人王長(cháng)虎在年初接受采訪(fǎng)時(shí)也提到:“在未來(lái)6-12個(gè)月里,我們希望用AI制作出15秒長(cháng)的可消費內容。只有當普通人都能用AI生成出好看、好玩的內容,才是AI視頻的ChatGPT時(shí)刻”。

目前看來(lái),高算力、高成本依舊是商業(yè)化的主要障礙,但不少視頻玩家也從中找到了用戶(hù)留存的新方法,“AI整活”“老照片動(dòng)起來(lái)”“AI修復”等抽象玩法在互聯(lián)網(wǎng)上層出不窮。

在大多數用戶(hù)對AI視頻工具的新鮮感褪去之后,如何用新玩法留住用戶(hù),摸索出新的賺錢(qián)方法,或許會(huì )是視頻內容玩家下一個(gè)競爭賽道。

收藏0
標簽: PixVerseScene

發(fā)表評論

訪(fǎng)客

看不清,換一張

◎歡迎參與討論,請在這里發(fā)表您的看法和觀(guān)點(diǎn)。
中文字幕在线永久91_国产一级AV不卡毛片_亚洲日本中文字幕在线四区_日韩黄片在线大全