首頁|必讀|視頻|專訪|運(yùn)營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁 >> 人工智能 >> 正文

云計(jì)算大廠暗戰(zhàn)大模型

2024年1月12日 08:13  界面新聞  

在大模型成為風(fēng)口之初,頭部初創(chuàng)公司Minimax曾舉辦了一場(chǎng)招標(biāo)會(huì)來采購算力。

阿里云、百度云和字節(jié)旗下的火山引擎均在競(jìng)標(biāo)受邀之列,現(xiàn)場(chǎng)出現(xiàn)了互聯(lián)網(wǎng)行業(yè)許久不見的火藥味。

各家自有算盤,也對(duì)這個(gè)客戶志在必得:阿里云市場(chǎng)份額還在第一,但已經(jīng)有下跌之勢(shì),保住地位是當(dāng)務(wù)之急;百度云在基礎(chǔ)架構(gòu)服務(wù)層的客戶積累比較薄弱,想多搶一些份額;火山引擎連市場(chǎng)份額排名的榜單都進(jìn)不去,想借著大模型客戶的機(jī)會(huì)再往上沖一沖。

三家工作人員在精心制作的PPT里展示自己的技術(shù)特點(diǎn)和優(yōu)勢(shì),但Minimax方面參評(píng)的技術(shù)專家們對(duì)此并不感興趣。價(jià)格,是他們最終且唯一關(guān)注的要素。

局面最終演變成了競(jìng)價(jià)會(huì)。

“5折!

“4.8折!

“4.5折。”

對(duì)于常規(guī)客戶,各家云計(jì)算平臺(tái)能夠給到的價(jià)格在6折到5折左右,但此次競(jìng)價(jià)已經(jīng)沖破原來的標(biāo)準(zhǔn)——互聯(lián)網(wǎng)大廠也在降本提效,最近一兩年大家已經(jīng)不愿意以低價(jià)換市場(chǎng)份額。但一位參與競(jìng)標(biāo)的架構(gòu)師把當(dāng)時(shí)的場(chǎng)面形容為“大家奔著不要錢的方向去了”,最后的成交價(jià)低至2折。

在競(jìng)標(biāo)之前,這位架構(gòu)師根本沒有意料到如此競(jìng)價(jià)的場(chǎng)面,底價(jià)也沒有提前在公司內(nèi)部溝通。到最后他根本不敢再出價(jià),最終丟了這個(gè)標(biāo)。

贏家是火山引擎。他們不惜一切代價(jià)想要爭(zhēng)奪下這家大客戶,延續(xù)了字節(jié)跳動(dòng)“大力出奇跡”的慣性。

但并不是每一次“大力”都能出奇跡。幾個(gè)月后,火山引擎又丟掉了這個(gè)大客戶。

“核心競(jìng)爭(zhēng)力是什么?”

無論是阿里云、百度云還是火山引擎,這些大廠的云計(jì)算平臺(tái),都太需要大模型客戶了。

甚至在大模型還沒有被打上聚光燈前,Minimax、智譜AI等頭部大模型客戶已經(jīng)成為兵家必爭(zhēng)之地——這是云計(jì)算廠商近幾年來為數(shù)不多的增量客戶。

隨著這些大模型公司業(yè)務(wù)體量的擴(kuò)張,每天的調(diào)用量都在指數(shù)級(jí)增長。早期他們往往依靠自建的小規(guī)模算力平臺(tái)即可滿足需求,但兩三年以后,自己的算力肯定是不夠用了。

去年3月,大模型被ChatGPT驟然推上風(fēng)口。頭部初創(chuàng)公司融資屢創(chuàng)記錄,投資人和大廠也接連涌入。大模型對(duì)外要講的第一個(gè)故事就是大模型能力,訓(xùn)練參數(shù)規(guī)模是其中重要指標(biāo),而算力決定了大模型訓(xùn)練的質(zhì)量和速度。

拿到足夠多的錢之后,大模型公司進(jìn)入了一個(gè)瘋狂采購算力的階段!笆遣皇谴嬖诶速M(fèi)的情況,根本不是他們關(guān)注的重點(diǎn)。”一位數(shù)據(jù)中心從業(yè)者對(duì)界面新聞?wù)f。

大模型公司向云計(jì)算公司傳遞焦慮,而云計(jì)算平臺(tái)轉(zhuǎn)而瘋狂向英偉達(dá)采購用于AI計(jì)算的GPU芯片。在目前的形勢(shì)下,英偉達(dá)GPU等同于“算力”,幾乎沒有替代品,A800是國內(nèi)能買到最好的芯片。

但英偉達(dá)的產(chǎn)能完全跟不上全球大模型公司洶涌而至的AI算力需求。

一位知情人士告訴界面新聞,國內(nèi)云計(jì)算平臺(tái)中,火山引擎采購量比較大,規(guī)模約有幾萬張計(jì)算卡,但英偉達(dá)根本無法保證交貨時(shí)間。據(jù)其透露,火山引擎一家去年和英偉達(dá)簽的訂單量已經(jīng)達(dá)到了前年BAT三家的總和,而BAT幾家大廠和英偉達(dá)的訂單已經(jīng)簽到了2024年。

也正是在這個(gè)關(guān)鍵時(shí)間,因?yàn)樗懔Ω簧,火山引擎最終丟掉了靠低價(jià)競(jìng)標(biāo)得來的大客戶Minimax。

就連更早向英偉達(dá)采購GPU芯片的公司也未能如愿。云從科技副總裁張立告訴界面新聞,其在前年12月采購的A800芯片按約定在23年4月到貨,但因?yàn)?月大模型被炒出風(fēng)口,訂單延期三四個(gè)月才交付!熬拖袷菙D牙膏一樣,每個(gè)月供一點(diǎn)!

在對(duì)A800芯片的爭(zhēng)奪中,英偉達(dá)處于絕對(duì)強(qiáng)勢(shì)的位置。上述知情人士透露,在和國內(nèi)各家云計(jì)算平臺(tái)的交付合同中,英偉達(dá)不接受不能按時(shí)交付需支付違約金的懲罰性條款,能交付多少就交付多少!叭绻銏(jiān)持想要違約金,那對(duì)方一張都不賣了!

A800買不到,但大模型訓(xùn)練不能停。Minimax只能放棄火山引擎,再次多方尋找算力——但阿里云和百度云也沒有搶到這個(gè)覬覦已久的客戶,因?yàn)樗麄円矝]有足夠多的GPU。

Minimax甚至找到了一家服務(wù)器公司,而這家服務(wù)器公司又試圖通過參與競(jìng)標(biāo)的大廠購買顯卡——產(chǎn)業(yè)鏈上下游邏輯被徹底打亂了,無人在意服務(wù)器公司根本沒有支撐大模型訓(xùn)練的能力,只要你有A800,跟誰買都行。

“我們的核心競(jìng)爭(zhēng)力是什么?根本沒有核心競(jìng)爭(zhēng)力!逼渲幸患掖髲S的云計(jì)算平臺(tái)銷售負(fù)責(zé)人李武對(duì)界面新聞?wù)f。

最終,這家優(yōu)質(zhì)的大模型客戶被擁有足夠數(shù)量英偉達(dá)芯片的騰訊云挖角。

目睹了Minimax尋找算力全過程的李武告訴界面新聞,騰訊云對(duì)外宣稱自己的異構(gòu)計(jì)算能力等等優(yōu)勢(shì),但這些能力都沒那么重要。大模型公司最核心的需求就是模型跑起來之后不能宕機(jī),否則需要從頭再跑一遍,浪費(fèi)時(shí)間就等于浪費(fèi)錢。幾家互聯(lián)網(wǎng)大廠都在努力保證服務(wù)的穩(wěn)定性,實(shí)際上技術(shù)能力的差異性并不大。

產(chǎn)品沒有獨(dú)特的競(jìng)爭(zhēng)力,這意味著誰家擁有更多的A800,誰就擁有了“核心競(jìng)爭(zhēng)力”。

從搶客戶到搶卡大戰(zhàn)

誰也沒有預(yù)料到,云計(jì)算平臺(tái)的競(jìng)爭(zhēng)已經(jīng)演變?yōu)榱艘粓?chǎng)“搶卡大戰(zhàn)”。

去年10月17日,美國更新了針對(duì)人工智能芯片的出口管制規(guī)定,英偉達(dá)包括A800和H800在內(nèi)的GPU芯片對(duì)華出口都受到影響。

A800的價(jià)格隨之水漲船高,到了一天一個(gè)價(jià)格的地步。

而國內(nèi)云計(jì)算平臺(tái)在前年第四季度給英偉達(dá)下的訂單,到去年底才幾乎供齊。去年二三季度的訂單對(duì)于這些甲方來說,交付依然遙遙無期。

“雖然訂單已經(jīng)下了,但英偉達(dá)會(huì)不會(huì)違約?這些訂單到底啥時(shí)候能供貨?到貨的時(shí)候大模型的算力需求還存不存在?還能不能賺到錢?這些問題我們真的判斷不了!币患以朴(jì)算平臺(tái)高管對(duì)此非常頭疼。

從23年年中到現(xiàn)在,A800芯片的價(jià)格已經(jīng)從8萬元左右一路上漲到了17萬元左右。買到卡囤幾個(gè)月再賣掉,變成了一個(gè)投機(jī)的好生意,但并不是所有人都有這樣的眼光。

當(dāng)各家云計(jì)算平臺(tái)和服務(wù)器公司都瘋狂找卡的時(shí)候,一個(gè)“笑話”在業(yè)界流傳:2022年初,騰訊云囤了幾萬張英偉達(dá)計(jì)算卡,但他們覺得沒有太大多用處,年中又把一批卡轉(zhuǎn)手賣給了火山引擎。后來騰訊自然是十分后悔,因?yàn)檫@相當(dāng)于幾億元的利潤沒了。

到了2023年,騰訊云也因?yàn)槿笨绷。?jù)一位和騰訊云合作的服務(wù)器廠商高管透露,后來騰訊云拿到一批A800之后,因?yàn)橐逼壬暇,騰訊云的工程師和服務(wù)器廠商的工程師現(xiàn)場(chǎng)攢機(jī),一天可以攢8-10臺(tái),攢完就立即交付上線。

而算力價(jià)格波動(dòng)甚至讓云計(jì)算平臺(tái)的產(chǎn)研們也非?鄲馈幢闼麄兘(jīng)歷過云計(jì)算行業(yè)殘酷的價(jià)格戰(zhàn),也沒有見過要每天要像盯股市大盤一樣盯A800價(jià)格的陣仗。

作為一個(gè)服務(wù)產(chǎn)品,云計(jì)算銷售給予不同客戶的折扣尺度有相當(dāng)大的浮動(dòng)空間,背后依托的正是產(chǎn)研對(duì)成本和利潤的核算。傳統(tǒng)意義上,低于3折的價(jià)格肯定會(huì)讓公司成本難以為繼,但如果為了爭(zhēng)取到一個(gè)優(yōu)質(zhì)客戶,這樣的虧損可以通過時(shí)間和其他客戶的利潤攤平——這也是過去廠商們價(jià)格戰(zhàn)的核心策略,能夠計(jì)算準(zhǔn)確的前提是成本保持穩(wěn)定。

但沒有人能預(yù)見A800之后幾個(gè)月的價(jià)格,而新的芯片供給還需要再等——英偉達(dá)計(jì)劃在今年第二季度量產(chǎn)符合美國出口規(guī)定的AI芯片H20。這款芯片本來應(yīng)該在去年11月推出,但服務(wù)器廠商在集成芯片時(shí)遇到了困難。屆時(shí)國內(nèi)的大客戶們誰能夠搶到這一批芯片,還很難有定論。

因此,對(duì)于廠商來說,定價(jià)還是難題;蛟S這個(gè)月打三折,公司還有毛利;再過幾個(gè)月,報(bào)價(jià)打五折都不一定能夠回本。

客戶也在精打細(xì)算的過日子。雖然去年3月以來,各家初創(chuàng)公司對(duì)算力的需求迫切,但隨著下半年風(fēng)口漸停,融資變得沒有那么容易了,在采購算力的時(shí)候,大模型公司也更加看重價(jià)格。

原本在降本增效的背景下,從2023年開始,阿里、騰訊和百度等幾家大廠在整體戰(zhàn)略上已經(jīng)放棄了以價(jià)格戰(zhàn)換市場(chǎng)的思路,僅僅針對(duì)個(gè)別優(yōu)質(zhì)客戶去打價(jià)格戰(zhàn)。

而在目前缺卡的背景下,價(jià)格甚至也缺乏說服力,資源變成了唯一的子彈。行業(yè)內(nèi)的挖角方式變成了,即使甲方已經(jīng)和某家平臺(tái)簽下了訂單,依然會(huì)有人找上門來,“告訴你對(duì)方缺卡,我們這里還有算力,要不你先過來跑!

在大模型風(fēng)口之下,想要通過出售算力賺錢的“賣水人”——那些云計(jì)算平臺(tái),沒人有底氣說自己賺到錢了。只有英偉達(dá),成為了那家真正賺到錢的公司。

大模型不是云計(jì)算大廠的出路

“你希望算力能夠?qū)崿F(xiàn)什么價(jià)值?”

在不斷被客戶問“有沒有卡”時(shí),AWS的銷售總監(jiān)趙孟總是試圖把話題推向另一個(gè)維度。

一卡難求的局面不僅影響到了大模型行業(yè),互聯(lián)網(wǎng)、游戲等領(lǐng)域的客戶也有各自新增的算力需求。如何在有限的資源條件下平衡不同的客戶,也是云計(jì)算平臺(tái)面臨的另一個(gè)難題。

在大模型公司對(duì)云計(jì)算方的考察中,有沒有卡成為了決定性因素,但云計(jì)算平臺(tái)自身能力的差異化缺被忽視。在趙孟看來,只有了解對(duì)方想用算力解決什么問題,云計(jì)算平臺(tái)才能發(fā)揮出更大的價(jià)值。

簡(jiǎn)單來說,云計(jì)算平臺(tái)賺的錢本身就是其附加價(jià)值——從上游采購服務(wù)器資源,再通過提供統(tǒng)一化、標(biāo)準(zhǔn)化的服務(wù)接口,可以讓客戶在無需關(guān)注服務(wù)器設(shè)備的情況下,更靈活的使用計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源。

這是云計(jì)算平臺(tái)作為“中間商”能夠替客戶省心的作用,但當(dāng)上游服務(wù)器所需要的GPU不斷漲價(jià)也一卡難求時(shí),云計(jì)算平臺(tái)能從附加價(jià)值中賺到的錢已經(jīng)所剩無幾。

趙孟更希望自己出售給客戶的不僅僅是算力,而是幫助他們解決問題的工程化支持和工具,“OpenAI本質(zhì)上也提供算力,真正有價(jià)值的是能被應(yīng)用層使用的能力。”

實(shí)際上,包括阿里云和百度云也是類似的思路,他們都在訓(xùn)練自己的大模型,希望向應(yīng)用層的公司出售其大模型的能力。

但并不是所有人都接受云計(jì)算廠商們的方案?蛻魞蓸O分化非常明顯,而不接受的客戶占比更大。

當(dāng)趙孟去向游戲和互聯(lián)網(wǎng)客戶講述大模型的能力,客戶們的心態(tài)往往會(huì)經(jīng)歷三個(gè)階段:第一階段是受到震撼;第二階段是展開想象、想象大模型能力能夠如何為自己落地應(yīng)用;到真正收斂需求的第三個(gè)階段,沒有人真正知道大模型能提供什么實(shí)際的價(jià)值。

除了價(jià)值模糊,這條路的另一個(gè)阻力是收入微薄。

從界面新聞獲得的一份百度智能云千帆大模型平臺(tái)的調(diào)用數(shù)據(jù)情況來看,大模型應(yīng)用層給云計(jì)算平臺(tái)帶來的商業(yè)收益十分有限,甚至遠(yuǎn)不如直接出售算力。

這份數(shù)據(jù)顯示,目前百度智能云千帆大模型平臺(tái)周調(diào)用量過萬的已經(jīng)是超級(jí)大客戶。但核算成收入每個(gè)月僅為幾萬元,這與預(yù)訓(xùn)練大模型的前期投入成本完全不成比例。相比之下,一個(gè)新能源汽車客戶一年給百度云帶來的收入可以達(dá)到幾億元。

百度千帆大模型平臺(tái)的一位業(yè)務(wù)負(fù)責(zé)人向界面新聞表示,“業(yè)界對(duì)大語言模型的預(yù)期被炒的過高,但它并不是萬能的!蹦壳捌鋺(yīng)用也僅限于文檔處理、客服等少數(shù)幾個(gè)場(chǎng)景,真正需要人工智能提升生產(chǎn)力的工業(yè)制造領(lǐng)域,大模型目前還談不上有可發(fā)揮的空間。

“年初想大干一場(chǎng),現(xiàn)在已經(jīng)不抱什么希望!边@位負(fù)責(zé)人在2023年下半年接到了一家頭部大模型初創(chuàng)公司的橄欖枝,對(duì)方承諾了數(shù)量可觀的期權(quán)。在過去五到十年的風(fēng)口中,這樣的挖角可能意味著財(cái)富自由的機(jī)會(huì),但這一次,這位負(fù)責(zé)人并沒有太多興奮感。

“大模型的風(fēng)口真的存在嗎?”他問出了心中盤旋已久的疑惑!叭绻竽P偷娘L(fēng)口都不存在,云計(jì)算大廠的出路又在哪里呢?”

(應(yīng)采訪對(duì)象要求,文中李武、趙孟為化名)

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張?jiān)泼鳎捍蟛糠謬倚聞澐至酥蓄l段6G頻譜資源
精彩專題
專題丨“汛”速出動(dòng) 共筑信息保障堤壩
2023MWC上海世界移動(dòng)通信大會(huì)
中國5G商用四周年
2023年中國國際信息通信展覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像