三個(gè)月九次迭代 快手可靈AI面向全球發(fā)布1.5模型
9月19日,可靈AI迎來(lái)重磅升級,視頻生成新增可靈1.5模型,在畫(huà)質(zhì)質(zhì)量、動(dòng)態(tài)質(zhì)量、美學(xué)表現、運動(dòng)合理性以及語(yǔ)義理解等方面均有顯著(zhù)提升。與此同時(shí),可靈AI還引入了全新的“運動(dòng)筆刷”功能,進(jìn)一步提升視頻生成的精準控制能力。
首先是基座模型再次升級,新增可靈1.5模型,支持在高品質(zhì)模式下,直出1080p高清視頻,挑戰大屏清晰度與質(zhì)感。與可靈 1.0 模型相比,1.5模型在畫(huà)面質(zhì)量、動(dòng)態(tài)質(zhì)量、文本響應度等方面有顯著(zhù)效果提升,其內部評測整體效果提升95%。
此前,可靈1.0模型在高品質(zhì)模式可生成720p視頻,本次升級后,1.5模型高品質(zhì)模式可直接生成1080p高清視頻。通過(guò)輸入提示詞“女孩看著(zhù)車(chē)窗”,對比左右兩個(gè)版本視頻生成的效果,可以發(fā)現,可靈1.5新模型的畫(huà)面質(zhì)量提升顯著(zhù):畫(huà)面清晰度有直觀(guān)可感,畫(huà)面右側的女孩面部細節更清晰豐富,車(chē)窗的水霧、整體光影表現等也都更加出色。同時(shí),新模型下畫(huà)面整體構圖也進(jìn)一步優(yōu)化,畫(huà)面更具美感。
在動(dòng)態(tài)質(zhì)量方面,新模型也有顯著(zhù)提升。例如,對比可靈AI此前火爆出圈的吃面案例,輸入提示詞“小男孩吃面”,右側1.5模型生成的視頻中,面條從被夾起到入口這一過(guò)程中,在彈性、垂墜感等方面有非常真實(shí)的物理表現,同時(shí)小男孩右手握住筷子和吃面時(shí)的咀嚼動(dòng)作,也都較左側1.0模型更加自然流暢,整體運動(dòng)合理性大大增強。
在圖生視頻方面,可靈全新的1.5模型可以響應更復雜的文本描述要求。例如通過(guò)一張沒(méi)有人物的食物照片和提示詞“鏡頭拉遠,一個(gè)小男孩走到桌前拿起勺子開(kāi)始吃飯”。在生成的視頻中,隨著(zhù)鏡頭的微微晃動(dòng),一個(gè)勺子“入場(chǎng)”,然后畫(huà)面聚焦到握著(zhù)勺子的小男孩,看他將一勺飯菜送到嘴里,勺子在碗里撥開(kāi)飯粒的細節也都被細致地呈現了出來(lái),顯示出強大的圖生視頻理解能力。
本次升級,可靈AI還帶來(lái)了強大的“運動(dòng)筆刷”功能,大幅提升了圖生視頻時(shí)創(chuàng )作者對運動(dòng)效果的控制能力。“運動(dòng)筆刷”功能支持為圖片中的元素(人或物體等)指定運動(dòng)軌跡,用戶(hù)只需將圖片中需要控制運動(dòng)方向的部分勾勒出來(lái),然后畫(huà)一個(gè)示意運動(dòng)方向箭頭,就可實(shí)現精準運動(dòng)控制。該功能支持上傳圖片后最多為圖中的 6 個(gè)元素(人或物體等)指定運動(dòng)軌跡。此外,還可以為某些元素額外指定靜止區域,讓視頻內容有更好的運動(dòng)控制及運動(dòng)表現。
目前,橫屏(16:9、4:3)、豎屏(9:16、3:4)、方屏(1:1)等多種尺寸格式的圖片,都支持使用「運動(dòng)筆刷」生成視頻,生成視頻時(shí)長(cháng)為5秒。大量用戶(hù)和媒體的評測顯示,可靈AI的運動(dòng)筆刷功能,在易用性、效果表現等方面均為業(yè)內領(lǐng)先。
實(shí)際上,可靈AI近期還進(jìn)行了一系列其他功能升級,諸如支持一次性生成最多 4 條視頻,方便創(chuàng )作者快速選取到最優(yōu)生成結果;“圖生視頻”功能新增支持 10 秒時(shí)長(cháng)并在標準模式下支持增加尾幀;“AI圖片”功能支持“畫(huà)質(zhì)增強”。此外,官方還上線(xiàn)了使用指南,幫助用戶(hù)更好地掌控可靈AI。
自今年6月發(fā)布以來(lái),這已經(jīng)是可靈AI累計第9次迭代升級。本次升級也將同步面向全球展開(kāi),今年7月,可靈AI宣布國際版1.0正式上線(xiàn),正式面向全球用戶(hù)開(kāi)放,隨后又推出了全球會(huì )員體系。目前,可靈AI目前已經(jīng)累積了大量的國內外用戶(hù),快手高級副總裁、主站業(yè)務(wù)與社區科學(xué)線(xiàn)負責人蓋坤此前在快手投資者日上披露,已有累計超260萬(wàn)人使用過(guò)可靈AI,并累計生成超2700萬(wàn)個(gè)視頻、5300萬(wàn)張圖片。
免責聲明:本文僅供參考,不構成投資建議。
廣告