南方財(cái)經(jīng)全媒體記者 吳立洋 上海報(bào)道
算力、數(shù)據(jù)與算法,在本輪人工智能大模型產(chǎn)業(yè)興起時(shí)被稱為行業(yè)發(fā)展最重要的三大要素,隨著ChatGPT帶動(dòng)的通用大模型熱潮褪去與垂直賽道大模型的涌現(xiàn),上述三大要素的細(xì)分需求亦隨之發(fā)生變化。
在近日舉辦的2024云棲大會(huì)上,阿里云展示了全新升級(jí)后的AI Infra系列產(chǎn)品及能力,據(jù)其介紹,該模型中臺(tái)連續(xù)訓(xùn)練有效時(shí)長大于99%,模型算力利用率提升20%以上。隨著GPU供給漸趨穩(wěn)定與架構(gòu)方式的不斷優(yōu)化,算力降價(jià)亦成為各大云廠商的普遍趨勢(shì)。
在訓(xùn)練數(shù)據(jù)供給方面,高質(zhì)量、細(xì)分領(lǐng)域數(shù)據(jù)仍是稀缺資源,但圍繞數(shù)據(jù)采集、清晰、交易的產(chǎn)業(yè)流程已漸趨完善,各行業(yè)對(duì)數(shù)據(jù)采集與利用重要性的認(rèn)識(shí)亦不斷加深。
而在各大廠商爭相發(fā)布自身的通用大模型后,面向細(xì)分領(lǐng)域及場(chǎng)景需求的垂直類大模型,開始成為AI商業(yè)化落地過程中最重要的賽道——畢竟如若無法與市場(chǎng)需求對(duì)接,智能性再強(qiáng)的大模型也很難擁有支撐其長期迭代訓(xùn)練的土壤。
在本屆大會(huì)上,豐富且多元的大模型應(yīng)用似乎也在先在顯示這樣一種現(xiàn)實(shí):此前被認(rèn)為可能不及算力與數(shù)據(jù)重要的算法,成為大模型面向具體領(lǐng)域商業(yè)化的重要環(huán)節(jié),且這種面向具體場(chǎng)景的算法競(jìng)爭,也對(duì)算力和數(shù)據(jù)供給反向提出了新的要求。
成本降低
企業(yè)對(duì)大模型價(jià)格的書名可能存在差異,但定價(jià)無疑是最難以說謊的直觀數(shù)據(jù)。從公開價(jià)格來看,無論是大模型調(diào)用的價(jià)格還是算力價(jià)格,在過去一年都開始呈現(xiàn)下降趨勢(shì)。
以阿里云為例,百煉平臺(tái)上的三款通義千問主力模型中,Qwen-Turbo價(jià)格直降85%,Qwen-Plus和Qwen-Max分別再降價(jià)80%和50%;阿里巴巴集團(tuán)CEO、阿里云智能集團(tuán)董事長兼CEO吳泳銘在主論壇開幕式上表示,通義千問API在阿里云百煉上的調(diào)用價(jià)格下降了97%,百萬tokens調(diào)用花費(fèi)最低降到0.5元。
今年4月,SCNet國家超算互聯(lián)網(wǎng)官網(wǎng)給出的英偉達(dá)A800人工智能訓(xùn)卡每小時(shí)訓(xùn)練價(jià)格降低到2元,且伴隨著眾多大模型開源,很多企業(yè)的訓(xùn)練需求也由整體的模型訓(xùn)練轉(zhuǎn)為對(duì)成熟模型的二次訓(xùn)練調(diào)整,疊加GPU供給度過極度緊缺狀態(tài),算力價(jià)格得以有所下滑。
阿里云副總裁張啟在大會(huì)發(fā)言中表示,目前新增的算力需求AI占比已經(jīng)超過了50%,這意味著整個(gè)算力市場(chǎng)的主體需求正從原來的CPU轉(zhuǎn)向AI計(jì)算,且這一趨勢(shì)的加速度仍會(huì)不斷提高。吳泳銘也不禁在大會(huì)發(fā)言中感慨,過去一年,阿里云投資新建了大量的AI算力,但還是遠(yuǎn)遠(yuǎn)不能滿足客戶的旺盛需求。
“現(xiàn)在我們也瘋狂搞AI大基建,只有把資費(fèi)降到足夠低,才有可能去談未來應(yīng)用的爆發(fā)!睆垎⒈硎。
而在數(shù)據(jù)方面,無論是對(duì)通用大模型還是垂直類大模型,高質(zhì)量、專業(yè)化的數(shù)據(jù)依然是各大廠商急需的訓(xùn)練資源,在本次云棲大會(huì)期間,與數(shù)據(jù)相關(guān)的產(chǎn)品和話題也受到廣泛關(guān)注。
例如在產(chǎn)品方面,海天瑞聲(42.550, -0.16, -0.37%)發(fā)布的DOTS一體化數(shù)據(jù)服務(wù)平臺(tái)、51Sim展示的合成數(shù)據(jù)集及針對(duì)3D數(shù)據(jù)生產(chǎn)的工具鏈,均是圍繞專業(yè)化數(shù)據(jù)采集、清洗提供的解決方案。
此外,對(duì)于大模型廠商而言,專業(yè)領(lǐng)域的數(shù)據(jù)積累,也成為其提升模型質(zhì)量,構(gòu)建自身競(jìng)爭力的主要優(yōu)勢(shì)所在。
精準(zhǔn)學(xué)CEO楊仁斌在接受南方財(cái)經(jīng)全媒體記者采訪時(shí)表示,就教育領(lǐng)域的大模型而言,核心的競(jìng)爭壁壘在于數(shù)據(jù)積累,其基于自研語音端到端“心流大模型”開發(fā)的“超擬人AI一對(duì)一老師”,就是依托大量題庫、學(xué)生行為反饋數(shù)據(jù)以及教育語音數(shù)據(jù)訓(xùn)練而成,充足且與應(yīng)用場(chǎng)景高度相關(guān)的數(shù)據(jù),能夠顯著提升AI生成內(nèi)容的精確度及用戶體驗(yàn)。
應(yīng)用先行
多模態(tài),是本屆云棲大會(huì)的另一重點(diǎn)話題。
作為東道主,阿里云放出的一大重要發(fā)布內(nèi)容便是通義萬相的全面升級(jí):搭載全新視頻生成功能,可生成影視級(jí)高清視頻,應(yīng)用于影視創(chuàng)作、動(dòng)畫設(shè)計(jì)、廣告設(shè)計(jì)等領(lǐng)域。
“圖形和視頻生成是當(dāng)前付費(fèi)意愿較強(qiáng)的領(lǐng)域之一,但是在商業(yè)化模式方面還沒有形成統(tǒng)一的路徑。”一位前來參會(huì)的寧波動(dòng)畫行業(yè)從業(yè)者在與記者交流時(shí)表示,除了C端訂閱制收費(fèi)外,B端的圖像生成需求往往對(duì)細(xì)節(jié)、連貫性等方面存在較高要求,這往往是單次大模型調(diào)用難以一次完成的,且針對(duì)不同的主題,內(nèi)容生成的質(zhì)量和速度也各不相同,因此對(duì)商用需求的交付標(biāo)準(zhǔn)、訓(xùn)練次數(shù)等,業(yè)界和模型提供者還在磨合過程中。
而在自動(dòng)駕駛領(lǐng)域,大模型的需求則相對(duì)明確。以本次帶著“全球首款A(yù)I汽車”P7+亮相云棲大會(huì)的小鵬汽車為例,端到端自動(dòng)駕駛、車載助力、通義靈碼的代碼編寫是其提到的小鵬運(yùn)用大模型的主要方向。
實(shí)際需求與大模型能力能否對(duì)接,本質(zhì)上考驗(yàn)的是模型算法與應(yīng)用場(chǎng)景的適配程度。值得注意的是,當(dāng)ToB還在反復(fù)衡量商業(yè)模式與算力成本時(shí),ToC應(yīng)用則已經(jīng)開始側(cè)重于個(gè)性化與定制服務(wù)。
在以體驗(yàn)和博弈為主要樂趣的游戲行業(yè),富有自由度和應(yīng)變能力的交互方式,被視為AI對(duì)游戲帶來的最大提升之一。例如巨人網(wǎng)絡(luò)(9.320, -0.08, -0.85%)于本次云棲大會(huì)展示的“AI殘局挑戰(zhàn)”就專注于高智慧行為,能夠根據(jù)不同局勢(shì)采取謀略、偽裝甚至互相“抱團(tuán)”。據(jù)展臺(tái)工作人員介紹,這種根據(jù)玩家對(duì)局情況進(jìn)行調(diào)整的功能能夠極大提升玩家的游玩樂趣。
在教育領(lǐng)域,楊仁斌則指出,一對(duì)一教學(xué)是最主要的需求之一,但不同學(xué)生的知識(shí)情況和學(xué)習(xí)習(xí)慣則各不相同,垂直類AI在升級(jí)后最重要的能力就是根據(jù)教學(xué)情況,及時(shí)切換教學(xué)方式,提升學(xué)習(xí)效果,增加教學(xué)資源供給。
“要以AI為中心構(gòu)建一切服務(wù)。而不是原有的產(chǎn)品加上一個(gè)AI模塊,這樣充其量只能叫用AI降本增效,但無法從本質(zhì)上解決問題!彼硎,這種能夠根據(jù)學(xué)生實(shí)時(shí)提問、反饋決定生成內(nèi)容個(gè)性化服務(wù),就是其ToC最主要的競(jìng)爭力和付費(fèi)支撐。