123,123,123

2024年大模型被焦慮裹挾，不再飛躍的技術(shù)、快要耗盡的數(shù)據(jù)、尚未出現(xiàn)的超級(jí)應(yīng)用……給這一年留下了遺憾，也為2025年大模型的發(fā)展定了調(diào)。

ChatGPT面世至今，大廠和創(chuàng)業(yè)公司高強(qiáng)度競(jìng)爭(zhēng)三年，差異化打法逐漸形成，談參數(shù)的越來越少，聚焦變現(xiàn)的越來越多，一個(gè)可對(duì)標(biāo)甚至超越移動(dòng)互聯(lián)網(wǎng)繁榮的大模型收獲季被期待。這場(chǎng)追逐中，更適應(yīng)市場(chǎng)的服務(wù)商和產(chǎn)品正在出現(xiàn)，實(shí)實(shí)在在的數(shù)據(jù)是參考：1—9月，國內(nèi)原生AIGC（人工智能生成內(nèi)容）App月活規(guī)模從3303萬漲到7913萬。

視頻必爭(zhēng)

斑駁的星球表面，升騰的飛船蒸汽，導(dǎo)演葉錦添的AIGC作品《快遞員》講述了外星快遞員Lili的一次冒險(xiǎn)。在導(dǎo)演李少紅的AI短片《花滿渚》中，太平公主、秀禾等經(jīng)典女性角色被AI技術(shù)串聯(lián)。2024年最后一個(gè)月，國內(nèi)九位導(dǎo)演把AI視頻類型從科幻類型擴(kuò)展到親情、動(dòng)畫等更多方向。

年初到年末，視頻模型的風(fēng)將大廠和創(chuàng)業(yè)公司都拉進(jìn)這個(gè)賽道，字節(jié)跳動(dòng)、生數(shù)科技、快手先發(fā)制人，全年幾乎每個(gè)月都有視頻大模型的新動(dòng)作曝光。最新消息是快手的可靈AI更新至1.6版本，累計(jì)生成超6500萬個(gè)視頻和超1.75億張圖片，騰訊混元大模型視頻生成功能“姍姍來遲”，字節(jié)跳動(dòng)的豆包視頻生成模型將于2025年1月正式對(duì)外開放服務(wù)。

事實(shí)是，“還是會(huì)‘無中生有’”，“主體一致性問題讓人頭大”，不是每個(gè)人都能熟練掌握視頻大模型。

“視頻生成的門檻還是挺高的，文生視頻的成功率不高，圖生視頻更主流�！彬v訊混元多模態(tài)生成技術(shù)負(fù)責(zé)人凱撒告訴北京商報(bào)記者。

在和新壹科技副總裁毛木子交流時(shí)，他也表示，“目前視頻生成模型市場(chǎng)仍處于起步階段，技術(shù)和應(yīng)用在不斷探索和完善中，市場(chǎng)參與者相對(duì)有限，產(chǎn)品迭代速度自然不如成熟市場(chǎng)快。從用戶體驗(yàn)視角看，雖然視頻生成模型迭代升級(jí)幅度可能不算大，但用戶對(duì)于高質(zhì)量、個(gè)性化視頻內(nèi)容的需求卻不斷增長(zhǎng)，這進(jìn)一步增加了視頻生成模型的技術(shù)難度和研發(fā)成本”。

面對(duì)一個(gè)新工具，使用者都要經(jīng)歷一段學(xué)習(xí)期，本就具有視頻制作功底的人知道“釘子”在哪里，只需要與“錘子”磨合，于是博納影業(yè)(6.450, -0.21, -3.15%)與抖音合作推出AI科幻短劇《三星堆：未來啟示錄》，快手推出AI奇幻短劇《山海奇鏡之劈波斬浪》。

質(zhì)量的提升是顯而易見的，北京師范大學(xué)藝術(shù)與傳媒學(xué)院講師王廷軒在線下分享“2024大學(xué)生AI藝術(shù)季”內(nèi)容時(shí)向北京商報(bào)記者透露，“在影像品質(zhì)上AI作品基本會(huì)在一個(gè)水平線上�；诨镜膶徝溃珹I可以讓一個(gè)相對(duì)業(yè)余的人只經(jīng)過一些簡(jiǎn)單的訓(xùn)練，作品就超過以往”。

對(duì)于2025年，毛木子的判斷是，“視頻生成賽道會(huì)更加注重內(nèi)容真實(shí)性和連貫性，以及個(gè)性化需求的滿足，在應(yīng)用場(chǎng)景上也將不斷拓展，廣告制作、影視創(chuàng)作到企業(yè)宣傳等領(lǐng)域都將受益于此。企業(yè)也會(huì)通過提供API接口、定制化服務(wù)等方式，將視頻生成技術(shù)應(yīng)用于更多場(chǎng)景中，實(shí)現(xiàn)盈利增長(zhǎng)”。

“數(shù)據(jù)墻”待解

和文生圖、文生文相比，視頻生成模型需要處理的信息量更多，這是技術(shù)突破難點(diǎn)。在整個(gè)大模型賽道，圍繞信息和數(shù)據(jù)要解決的問題，也絕對(duì)算得上是熱門話題。

“2024年，全球訓(xùn)練大語言模型的效果普遍不及預(yù)期，可能已經(jīng)撞上‘?dāng)?shù)據(jù)墻’。”為了證明這個(gè)結(jié)論，中國信通院云計(jì)算與大數(shù)據(jù)研究所所長(zhǎng)何寶宏拿OpenAI、Anthroipc等舉例，甚至直言大模型競(jìng)賽的上半場(chǎng)已經(jīng)進(jìn)入“垃圾時(shí)間”。

一個(gè)普遍的共識(shí)是過去30年來互聯(lián)網(wǎng)上積累的數(shù)據(jù)，將在未來3—5年內(nèi)被AI耗盡。“行業(yè)要‘卷’合成數(shù)據(jù)，也需要謹(jǐn)慎�！焙螌毢暾f。

談到Scaling Law（規(guī)模定律）放緩時(shí)，創(chuàng)新工場(chǎng)CEO李開復(fù)，獵豹移動(dòng)董事長(zhǎng)兼CEO、獵戶星空董事長(zhǎng)傅盛，月之暗面創(chuàng)始人楊植麟等都提到了數(shù)據(jù)。

“當(dāng)Scale（規(guī)模）差不多時(shí)，更多算力可能并不一定能直接解決問題，核心是高質(zhì)量的數(shù)據(jù)沒那么多了�！睏钪谗胝f。李開復(fù)發(fā)問，“當(dāng)人類寫的文字全部用于模型訓(xùn)練后，人類一年還能寫多少字？用合成數(shù)據(jù)、多模態(tài)數(shù)據(jù)都是可嘗試的方向，但這些數(shù)據(jù)的價(jià)值仍然不如原始的高質(zhì)量文本數(shù)據(jù)”。傅盛直接捅破窗戶紙，“大模型行業(yè)競(jìng)爭(zhēng)，真正的競(jìng)爭(zhēng)壁壘來自于數(shù)據(jù)”。

企業(yè)已經(jīng)在行動(dòng)，7月騰訊推出了一個(gè)名為Persona Hub的合成數(shù)據(jù)生成器，螞蟻在11月上線AI數(shù)據(jù)合成與生產(chǎn)平臺(tái)AIGD，通過大規(guī)模合成互聯(lián)網(wǎng)所不覆蓋的高質(zhì)量、高價(jià)值垂直語料數(shù)據(jù)，幫助科技廠商進(jìn)行AI模型訓(xùn)練。

但多個(gè)問題擺在眼前，確保這些AI生成數(shù)據(jù)的準(zhǔn)確性和無偏性是一個(gè)關(guān)鍵挑戰(zhàn)，合成數(shù)據(jù)會(huì)否破壞AI模型？到底多少合成數(shù)據(jù)才算過量？需要時(shí)間給出答案。

獵豹移動(dòng)切入數(shù)據(jù)的角度不太一樣，獵戶星空首席科學(xué)家韓堃告訴北京商報(bào)記者，“合成數(shù)據(jù)確實(shí)是一個(gè)很重要的補(bǔ)充，但僅僅使用合成數(shù)據(jù)肯定是不夠的”。獵豹移動(dòng)將重點(diǎn)放在大模型數(shù)據(jù)服務(wù)上，比如數(shù)據(jù)收集、清洗、標(biāo)準(zhǔn)、提示詞工程及評(píng)估等服務(wù)。它們也有靠經(jīng)驗(yàn)才能得到的答案，比如人工和機(jī)器處理數(shù)據(jù)的比例。

應(yīng)用大爆發(fā)

不管是合成還是服務(wù)，從另一個(gè)角度看，大模型公司正在告別同質(zhì)化競(jìng)爭(zhēng)，分散尋找價(jià)值洼地。

大模型“六小虎”（包括零一萬物、百川智能等六家獨(dú)立大模型初創(chuàng)公司）的行動(dòng)很快�！拔蚁朐龠^三年，六小虎中有些可能已經(jīng)變成‘龍’，有些變成‘狼’，有些變成‘兔子’了�！崩铋_復(fù)預(yù)測(cè)，“相信六小虎都會(huì)找到務(wù)實(shí)的、獨(dú)特的、有價(jià)值的方向。大廠有必須要做的事情，我們不應(yīng)該用大廠的模式跟它們競(jìng)爭(zhēng)，要找到自己擅長(zhǎng)的方向，做得比它們好，做大廠不會(huì)馬上會(huì)做的事情�！彼傅木褪谴竽Ｐ偷穆涞貞�(yīng)用。

和之前幾次互聯(lián)網(wǎng)風(fēng)口相比，差異化來得似乎更早一些，方向也更多元。百川智能創(chuàng)始人王小川的愿望是，“用AI大模型造醫(yī)生”；零一萬物的解決方案當(dāng)下主要面向電商直播、辦公會(huì)議等場(chǎng)景；智譜B端的中標(biāo)項(xiàng)目讓人羨慕……

創(chuàng)業(yè)公司希望避開大廠的射程，大廠則在想辦法既靈活又厚實(shí)。12月中下旬，阿里旗下的AI應(yīng)用“通義”被曝將正式從阿里云分拆，并入阿里智能信息事業(yè)群；通義to C方向的產(chǎn)品經(jīng)理以及相關(guān)的工程團(tuán)隊(duì)，一并調(diào)整至阿里智能信息事業(yè)群。調(diào)整后，通義PC及App團(tuán)隊(duì)與智能搜索產(chǎn)品“夸克”平級(jí)，原有的通義實(shí)驗(yàn)室仍留在阿里云體系內(nèi)。

雖然阿里集團(tuán)和阿里云就此均未回應(yīng)，但沖刺的信號(hào)不言而喻。

百度更不用說，創(chuàng)始人李彥宏早就喊出：智能體是AI應(yīng)用的最主流形式，即將迎來爆發(fā)點(diǎn)；百度不是要推出一個(gè)“超級(jí)應(yīng)用”，是要幫助更多人更多企業(yè)打造出數(shù)百萬“超級(jí)有用”的應(yīng)用。預(yù)計(jì)到2028年，中國AI Agent（智能體）市場(chǎng)規(guī)模將激增至8520億元，年復(fù)合增長(zhǎng)率達(dá)72.7%，銀河證券的預(yù)測(cè)只是佐證之一。

不久前，全國工業(yè)和信息化工作會(huì)議強(qiáng)調(diào)，2025年要加強(qiáng)通用大模型和行業(yè)大模型研發(fā)布局和重點(diǎn)場(chǎng)景應(yīng)用。可以預(yù)見，中國科技公司擅長(zhǎng)的應(yīng)用大戰(zhàn)蓄勢(shì)待發(fā)。

被期待的大模型收獲季