首頁|必讀|視頻|專訪|運(yùn)營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁 >> 移動(dòng)互聯(lián)網(wǎng) >> 正文

快手可靈AI面向全球發(fā)布1.5模型 新增“運(yùn)動(dòng)筆刷”效果業(yè)內(nèi)領(lǐng)先

2024年9月20日 09:46  CCTIME飛象網(wǎng)  

9月19日,可靈AI迎來重磅升級(jí),視頻生成新增可靈1.5模型,在畫質(zhì)質(zhì)量、動(dòng)態(tài)質(zhì)量、美學(xué)表現(xiàn)、運(yùn)動(dòng)合理性以及語義理解等方面均有顯著提升。與此同時(shí),可靈AI還引入了全新的“運(yùn)動(dòng)筆刷”功能,進(jìn)一步提升視頻生成的精準(zhǔn)控制能力。

首先是基座模型再次升級(jí),新增可靈1.5模型,支持在高品質(zhì)模式下,直出1080p高清視頻,挑戰(zhàn)大屏清晰度與質(zhì)感。與可靈 1.0 模型相比,1.5模型在畫面質(zhì)量、動(dòng)態(tài)質(zhì)量、文本響應(yīng)度等方面有顯著效果提升,其內(nèi)部評(píng)測(cè)整體效果提升95%。

此前,可靈1.0模型在高品質(zhì)模式可生成720p視頻,本次升級(jí)后,1.5模型高品質(zhì)模式可直接生成1080p高清視頻。通過輸入提示詞“女孩看著車窗”,對(duì)比左右兩個(gè)版本視頻生成的效果,可以發(fā)現(xiàn),可靈1.5新模型的畫面質(zhì)量提升顯著:畫面清晰度有直觀可感,畫面右側(cè)的女孩面部細(xì)節(jié)更清晰豐富,車窗的水霧、整體光影表現(xiàn)等也都更加出色。同時(shí),新模型下畫面整體構(gòu)圖也進(jìn)一步優(yōu)化,畫面更具美感。

在動(dòng)態(tài)質(zhì)量方面,新模型也有顯著提升。例如,對(duì)比可靈AI此前火爆出圈的吃面案例,輸入提示詞“小男孩吃面”,右側(cè)1.5模型生成的視頻中,面條從被夾起到入口這一過程中,在彈性、垂墜感等方面有非常真實(shí)的物理表現(xiàn),同時(shí)小男孩右手握住筷子和吃面時(shí)的咀嚼動(dòng)作,也都較左側(cè)1.0模型更加自然流暢,整體運(yùn)動(dòng)合理性大大增強(qiáng)。

在圖生視頻方面,可靈全新的1.5模型可以響應(yīng)更復(fù)雜的文本描述要求。例如通過一張沒有人物的食物照片和提示詞“鏡頭拉遠(yuǎn),一個(gè)小男孩走到桌前拿起勺子開始吃飯”。在生成的視頻中,隨著鏡頭的微微晃動(dòng),一個(gè)勺子“入場(chǎng)”,然后畫面聚焦到握著勺子的小男孩,看他將一勺飯菜送到嘴里,勺子在碗里撥開飯粒的細(xì)節(jié)也都被細(xì)致地呈現(xiàn)了出來,顯示出強(qiáng)大的圖生視頻理解能力。

本次升級(jí),可靈AI還帶來了強(qiáng)大的“運(yùn)動(dòng)筆刷”功能,大幅提升了圖生視頻時(shí)創(chuàng)作者對(duì)運(yùn)動(dòng)效果的控制能力!斑\(yùn)動(dòng)筆刷”功能支持為圖片中的元素(人或物體等)指定運(yùn)動(dòng)軌跡,用戶只需將圖片中需要控制運(yùn)動(dòng)方向的部分勾勒出來,然后畫一個(gè)示意運(yùn)動(dòng)方向箭頭,就可實(shí)現(xiàn)精準(zhǔn)運(yùn)動(dòng)控制。該功能支持上傳圖片后最多為圖中的 6 個(gè)元素(人或物體等)指定運(yùn)動(dòng)軌跡。此外,還可以為某些元素額外指定靜止區(qū)域,讓視頻內(nèi)容有更好的運(yùn)動(dòng)控制及運(yùn)動(dòng)表現(xiàn)。

目前,橫屏(16:9、4:3)、豎屏(9:16、3:4)、方屏(1:1)等多種尺寸格式的圖片,都支持使用「運(yùn)動(dòng)筆刷」生成視頻,生成視頻時(shí)長為5秒。大量用戶和媒體的評(píng)測(cè)顯示,可靈AI的運(yùn)動(dòng)筆刷功能,在易用性、效果表現(xiàn)等方面均為業(yè)內(nèi)領(lǐng)先。

實(shí)際上,可靈AI近期還進(jìn)行了一系列其他功能升級(jí),諸如支持一次性生成最多 4 條視頻,方便創(chuàng)作者快速選取到最優(yōu)生成結(jié)果;“圖生視頻”功能新增支持 10 秒時(shí)長并在標(biāo)準(zhǔn)模式下支持增加尾幀;“AI圖片”功能支持“畫質(zhì)增強(qiáng)”。此外,官方還上線了使用指南,幫助用戶更好地掌控可靈AI。

自今年6月發(fā)布以來,這已經(jīng)是可靈AI累計(jì)第9次迭代升級(jí)。本次升級(jí)也將同步面向全球展開,今年7月,可靈AI宣布國際版1.0正式上線,正式面向全球用戶開放,隨后又推出了全球會(huì)員體系。目前,可靈AI目前已經(jīng)累積了大量的國內(nèi)外用戶,快手高級(jí)副總裁、主站業(yè)務(wù)與社區(qū)科學(xué)線負(fù)責(zé)人蓋坤此前在快手投資者日上披露,已有累計(jì)超260萬人使用過可靈AI,并累計(jì)生成超2700萬個(gè)視頻、5300萬張圖片。

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中國電信邵廣祿:面向AI大模型的智算集群及網(wǎng)絡(luò)的實(shí)踐和展望
精彩專題
CES 2024國際消費(fèi)電子展
2023年信息通信產(chǎn)業(yè)盤點(diǎn)暨頒獎(jiǎng)禮
飛象網(wǎng)2023年手機(jī)評(píng)選
第24屆中國國際光電博覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像