9月19日,可靈AI迎來重磅升級(jí),視頻生成新增可靈1.5模型,在畫質(zhì)質(zhì)量、動(dòng)態(tài)質(zhì)量、美學(xué)表現(xiàn)、運(yùn)動(dòng)合理性以及語義理解等方面均有顯著提升。與此同時(shí),可靈AI還引入了全新的“運(yùn)動(dòng)筆刷”功能,進(jìn)一步提升視頻生成的精準(zhǔn)控制能力。
首先是基座模型再次升級(jí),新增可靈1.5模型,支持在高品質(zhì)模式下,直出1080p高清視頻,挑戰(zhàn)大屏清晰度與質(zhì)感。與可靈 1.0 模型相比,1.5模型在畫面質(zhì)量、動(dòng)態(tài)質(zhì)量、文本響應(yīng)度等方面有顯著效果提升,其內(nèi)部評(píng)測(cè)整體效果提升95%。
此前,可靈1.0模型在高品質(zhì)模式可生成720p視頻,本次升級(jí)后,1.5模型高品質(zhì)模式可直接生成1080p高清視頻。通過輸入提示詞“女孩看著車窗”,對(duì)比左右兩個(gè)版本視頻生成的效果,可以發(fā)現(xiàn),可靈1.5新模型的畫面質(zhì)量提升顯著:畫面清晰度有直觀可感,畫面右側(cè)的女孩面部細(xì)節(jié)更清晰豐富,車窗的水霧、整體光影表現(xiàn)等也都更加出色。同時(shí),新模型下畫面整體構(gòu)圖也進(jìn)一步優(yōu)化,畫面更具美感。
在動(dòng)態(tài)質(zhì)量方面,新模型也有顯著提升。例如,對(duì)比可靈AI此前火爆出圈的吃面案例,輸入提示詞“小男孩吃面”,右側(cè)1.5模型生成的視頻中,面條從被夾起到入口這一過程中,在彈性、垂墜感等方面有非常真實(shí)的物理表現(xiàn),同時(shí)小男孩右手握住筷子和吃面時(shí)的咀嚼動(dòng)作,也都較左側(cè)1.0模型更加自然流暢,整體運(yùn)動(dòng)合理性大大增強(qiáng)。
在圖生視頻方面,可靈全新的1.5模型可以響應(yīng)更復(fù)雜的文本描述要求。例如通過一張沒有人物的食物照片和提示詞“鏡頭拉遠(yuǎn),一個(gè)小男孩走到桌前拿起勺子開始吃飯”。在生成的視頻中,隨著鏡頭的微微晃動(dòng),一個(gè)勺子“入場(chǎng)”,然后畫面聚焦到握著勺子的小男孩,看他將一勺飯菜送到嘴里,勺子在碗里撥開飯粒的細(xì)節(jié)也都被細(xì)致地呈現(xiàn)了出來,顯示出強(qiáng)大的圖生視頻理解能力。
本次升級(jí),可靈AI還帶來了強(qiáng)大的“運(yùn)動(dòng)筆刷”功能,大幅提升了圖生視頻時(shí)創(chuàng)作者對(duì)運(yùn)動(dòng)效果的控制能力!斑\(yùn)動(dòng)筆刷”功能支持為圖片中的元素(人或物體等)指定運(yùn)動(dòng)軌跡,用戶只需將圖片中需要控制運(yùn)動(dòng)方向的部分勾勒出來,然后畫一個(gè)示意運(yùn)動(dòng)方向箭頭,就可實(shí)現(xiàn)精準(zhǔn)運(yùn)動(dòng)控制。該功能支持上傳圖片后最多為圖中的 6 個(gè)元素(人或物體等)指定運(yùn)動(dòng)軌跡。此外,還可以為某些元素額外指定靜止區(qū)域,讓視頻內(nèi)容有更好的運(yùn)動(dòng)控制及運(yùn)動(dòng)表現(xiàn)。
目前,橫屏(16:9、4:3)、豎屏(9:16、3:4)、方屏(1:1)等多種尺寸格式的圖片,都支持使用「運(yùn)動(dòng)筆刷」生成視頻,生成視頻時(shí)長為5秒。大量用戶和媒體的評(píng)測(cè)顯示,可靈AI的運(yùn)動(dòng)筆刷功能,在易用性、效果表現(xiàn)等方面均為業(yè)內(nèi)領(lǐng)先。
實(shí)際上,可靈AI近期還進(jìn)行了一系列其他功能升級(jí),諸如支持一次性生成最多 4 條視頻,方便創(chuàng)作者快速選取到最優(yōu)生成結(jié)果;“圖生視頻”功能新增支持 10 秒時(shí)長并在標(biāo)準(zhǔn)模式下支持增加尾幀;“AI圖片”功能支持“畫質(zhì)增強(qiáng)”。此外,官方還上線了使用指南,幫助用戶更好地掌控可靈AI。
自今年6月發(fā)布以來,這已經(jīng)是可靈AI累計(jì)第9次迭代升級(jí)。本次升級(jí)也將同步面向全球展開,今年7月,可靈AI宣布國際版1.0正式上線,正式面向全球用戶開放,隨后又推出了全球會(huì)員體系。目前,可靈AI目前已經(jīng)累積了大量的國內(nèi)外用戶,快手高級(jí)副總裁、主站業(yè)務(wù)與社區(qū)科學(xué)線負(fù)責(zé)人蓋坤此前在快手投資者日上披露,已有累計(jì)超260萬人使用過可靈AI,并累計(jì)生成超2700萬個(gè)視頻、5300萬張圖片。