首頁|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁 >> 大數(shù)據(jù) >> 正文

數(shù)據(jù)中心的功耗難題,液冷能解決嗎?

2024年7月15日 07:10  第一財(cái)經(jīng)  

耗能頗高的數(shù)據(jù)中心常被稱為“不冒煙的鋼廠”。這不僅是因?yàn)樘幚砥鬟\(yùn)行消耗大量電力,也是因?yàn)閿?shù)據(jù)中心需消耗更多能源,來冷卻高溫運(yùn)行中的服務(wù)器。幾年間,數(shù)據(jù)中心處理器功耗持續(xù)攀升,大模型更添一把“火”,業(yè)內(nèi)正在尋找新的冷卻方式。

“原來一個(gè)機(jī)柜40多U(長(zhǎng)度單位),有那么高,功耗不到8000瓦,現(xiàn)在常用于訓(xùn)練或推理的4U八卡機(jī)功耗達(dá)到10千瓦,體積才那么大一點(diǎn)!苯找粓(chǎng)采訪中,綠色云圖總經(jīng)理、網(wǎng)宿科技副總裁胡世軒用手比劃,向記者形容,服務(wù)器機(jī)柜變小了,但一臺(tái)高度不到2分米的服務(wù)器,現(xiàn)在卻成為功耗“怪獸”。

推高功耗表現(xiàn)的一大原因是AI。AI處理器功耗隨著性能提高而提高,傳統(tǒng)風(fēng)冷不再適合。有業(yè)內(nèi)人士告訴記者,目前各種液冷技術(shù)還在競(jìng)賽,但從大趨勢(shì)看,液冷已逐漸成為新建智算中心的標(biāo)配。

數(shù)據(jù)中心功耗難題

全球AI基礎(chǔ)設(shè)施競(jìng)賽還在進(jìn)行。與此同時(shí),應(yīng)用于AI場(chǎng)景的高性能芯片功耗越來越高。山西證券研報(bào)引用S&P Global數(shù)據(jù)稱,2017年主流芯片廠商TDP(熱設(shè)計(jì)功耗)僅200瓦左右,到2023年,一般GPU的TDP已經(jīng)達(dá)到350~700瓦,英偉達(dá)新一代B100功耗甚至超過1000瓦。

“原來一臺(tái)服務(wù)器功率大概500瓦、1000瓦,現(xiàn)在單張芯片就能達(dá)到500瓦了! 胡世軒向記者形容。

高功耗導(dǎo)向高排放。谷歌近日在其年度環(huán)境報(bào)告中指出,2023年公司溫室氣體排放量達(dá)到1430萬噸碳當(dāng)量,比2019年基準(zhǔn)高出48%。谷歌2023年與能源相關(guān)的排放量同比增長(zhǎng)37%,排放主要來自數(shù)據(jù)中心電力消耗。微軟總裁布拉德·史密斯5月也承認(rèn),公司的減排目標(biāo)受到人工智能戰(zhàn)略的影響。

高功耗導(dǎo)致芯片出現(xiàn)高溫,進(jìn)而影響芯片性能,業(yè)內(nèi)將這一現(xiàn)象成為“功耗墻”。冷卻成為必不可少的手段。一般而言,數(shù)據(jù)中心有約40%的功耗用于制冷系統(tǒng)。傳統(tǒng)數(shù)據(jù)中心多采用風(fēng)冷等傳統(tǒng)冷卻方式,但因應(yīng)對(duì)高功耗時(shí)的低能效,業(yè)內(nèi)出現(xiàn)了取代風(fēng)冷的聲音。

今年早些時(shí)候,英偉達(dá)CEO黃仁勛表示,液冷技術(shù)將成為AI算力的下一個(gè)趨勢(shì)性領(lǐng)域。英偉達(dá)從B100產(chǎn)品開始便采用液冷技術(shù)!包S仁勛認(rèn)為浸沒式液冷是未來方向,這是他的觀點(diǎn),不一定代表業(yè)界對(duì)液冷技術(shù)走向的共識(shí),但高功耗情況下,液冷確實(shí)是需要的。”一名服務(wù)器業(yè)內(nèi)人士告訴記者,如果說風(fēng)冷是吹風(fēng)扇、空調(diào),液冷則像泡澡。

英特爾資深技術(shù)專家近日接受第一財(cái)經(jīng)記者采訪時(shí)解釋,之所以風(fēng)冷不適應(yīng)高功耗場(chǎng)景,是因?yàn)閭鹘y(tǒng)風(fēng)冷風(fēng)扇轉(zhuǎn)速越快、散熱效果越好、風(fēng)扇轉(zhuǎn)動(dòng)耗能越高,但轉(zhuǎn)速達(dá)到某個(gè)臨界點(diǎn)后散熱效果提升有限,功耗卻上升明顯。風(fēng)冷對(duì)300瓦、350瓦功耗以上的處理器而言性價(jià)比不高。

記者從多名服務(wù)器業(yè)內(nèi)人士了解到,今年服務(wù)器出貨增長(zhǎng)較明顯的是智算中心常用的AI服務(wù)器。“據(jù)我們觀察,新建數(shù)據(jù)中心的冷卻方式以液冷為主,風(fēng)冷較少。我們和中國(guó)臺(tái)灣、美國(guó)的產(chǎn)業(yè)上下游廠商聊,發(fā)現(xiàn)大家的感覺都是‘今年跟以前明顯不一樣’。” 以上技術(shù)專家告訴記者,從存量市場(chǎng)看,多數(shù)數(shù)據(jù)中心仍采用風(fēng)冷,應(yīng)對(duì)高功耗時(shí)需通過加裝更多電風(fēng)扇、做大散熱器等方式‘打補(bǔ)丁’,確保已有處理器還能使用。但未來幾年,隨著數(shù)據(jù)中心逐漸轉(zhuǎn)向液冷,芯片廠商可能會(huì)轉(zhuǎn)向推出只考慮液冷環(huán)境下運(yùn)行的芯片。?松梨诤铣苫A(chǔ)油業(yè)務(wù)部門亞太市場(chǎng)總監(jiān)王欣也感受到,今年數(shù)據(jù)中心服務(wù)器冷卻液的需求有所增長(zhǎng)。

粗略分,液冷目前主要有兩種方式,冷板式液冷不需要浸沒芯片,浸沒式液冷則是將整臺(tái)服務(wù)器包括芯片浸在液體中,由液體帶走熱量。胡世軒向記者形容,做通用計(jì)算的數(shù)據(jù)中心發(fā)熱量不大,沒有必要打破由冷機(jī)、空調(diào)降溫的方式,而當(dāng)智算中心單U功耗達(dá)0.5千瓦的臨界值時(shí),液冷的效果和性價(jià)比都更高。

“液冷和風(fēng)冷相比,數(shù)據(jù)中心能節(jié)省20%以上能耗,我判斷其中用在制冷上的能耗可節(jié)省80%以上。風(fēng)冷數(shù)據(jù)中心PUE(數(shù)據(jù)中心電能利用效率)一般在1.5左右,有的地方要求做到1.3,從我們做的項(xiàng)目看,浸沒式液冷數(shù)據(jù)中心PUE則能做到1.1以下。” 胡世軒表示。

仍在發(fā)展初期

液冷能以較低能耗冷卻數(shù)據(jù)中心的處理器,但作為相對(duì)新興的技術(shù),目前部署液冷的價(jià)格仍偏高,各種液冷技術(shù)也仍在爭(zhēng)流。

液冷有一些技術(shù)挑戰(zhàn)需要攻克。王欣告訴記者,浸沒式液體把服務(wù)器所有硬件泡在里面,材料兼容是關(guān)鍵難題,此外,需要解決信號(hào)穩(wěn)定性、散熱性等問題,冷卻液廠商需要持續(xù)研發(fā)和更新。

此外,記者了解到,目前各方對(duì)冷卻方案的選擇各有判斷,共識(shí)還未形成。據(jù)市場(chǎng)研究機(jī)構(gòu)IDC數(shù)據(jù),去年國(guó)內(nèi)液冷服務(wù)器市場(chǎng)規(guī)模增長(zhǎng)52.6%,其中95%采用冷板式液冷。技術(shù)路線上看,冷板式和浸沒式都有單相和兩相兩種技術(shù)路線,單相采用氟碳化合物或合成油,雙相目前只有氟碳化合物散熱能力較高。

上述英特爾資深技術(shù)專家表示,單相冷板散熱效果出色、業(yè)界采用較多,但無法根除液體泄漏風(fēng)險(xiǎn)。兩相冷板所用的氟化物冷卻液泄漏后不會(huì)造成電路短路,但氟化物對(duì)環(huán)境有影響。氟化物在國(guó)際上有減少或禁止使用的趨勢(shì),英特爾目前支持基于合成油的單相冷板和單相浸沒式液冷技術(shù)。產(chǎn)業(yè)鏈也在根據(jù)目前的技術(shù)挑戰(zhàn)做調(diào)整。王欣表示,氟化液冷卻液非常穩(wěn)定,在自然界中不容易降解且價(jià)格較高,公司推出對(duì)環(huán)境影響較小的無PFAS(全氟和多氟烷基物質(zhì))浸沒式冷卻液,正與產(chǎn)業(yè)鏈合作,滿足浸沒式冷卻場(chǎng)景的技術(shù)指標(biāo)。

整體而言,上述英特爾資深技術(shù)專家告訴記者,現(xiàn)在液冷還沒有某種技術(shù)比另一種技術(shù)更有統(tǒng)治性優(yōu)勢(shì),未來需求也還不明確,每個(gè)技術(shù)都有優(yōu)缺點(diǎn),而且為了適應(yīng)未來需求還在繼續(xù)演進(jìn)。另有業(yè)內(nèi)人士告訴記者,液冷上游供應(yīng)鏈有不少廠家,技術(shù)有壁壘,競(jìng)爭(zhēng)也較激烈。

價(jià)格方面,胡世軒告訴記者,浸沒式和冷板式液冷的價(jià)格今年都在往下走。建造成本看,浸沒式液冷比傳統(tǒng)風(fēng)冷貴5%~8%,但預(yù)計(jì)部署規(guī)模增大后,兩年內(nèi)可以做到風(fēng)液同價(jià)。冷卻液廠商也在推動(dòng)冷卻液迭代降價(jià),現(xiàn)在已有產(chǎn)品價(jià)格比氟化物冷卻液低很多。

目前,液冷產(chǎn)業(yè)鏈上游為零部件及液冷設(shè)備廠商,國(guó)產(chǎn)廠商包括英維克、綠色云圖等,中游為液冷服務(wù)器及芯片廠商、液冷集成設(shè)施廠商,包括中興、浪潮、曙光、新華三等。產(chǎn)業(yè)鏈已形成一些合作。英特爾與綠色云圖、立訊精密、?松梨诘群献鏖_發(fā)液冷解決方案,6月推出PUE低于1.05的G-Tank浸沒式冷卻解決方案。英偉達(dá)則與液冷設(shè)備提供商Vertiv合作,超微電腦也針對(duì)英偉達(dá)芯片推出液冷系統(tǒng)。

從相關(guān)性較大的產(chǎn)業(yè)鏈上市企業(yè)看,部分股價(jià)或業(yè)績(jī)受液冷需求增長(zhǎng)催化,但整體冷熱不均。Vertiv股價(jià)從年初的每股45美元左右漲至美股7月11日92.86美元/股。英維克7月11日發(fā)布今年上半年業(yè)績(jī)預(yù)告,稱機(jī)房溫控節(jié)能產(chǎn)品增長(zhǎng)較快,上半年凈利潤(rùn)業(yè)績(jī)?cè)鲩L(zhǎng)80%~110%。全棧布局液冷的服務(wù)器廠商浪潮2023年曾受專用芯片供應(yīng)緊張影響,營(yíng)收、凈利潤(rùn)均同比減少,今年上半年預(yù)計(jì)營(yíng)收同比增長(zhǎng)60%以上。

今年第一季度,中科曙光旗下布局?jǐn)?shù)據(jù)中心冷卻技術(shù)的曙光數(shù)創(chuàng)營(yíng)收則同比下降94.22%,凈利潤(rùn)虧損,公司相關(guān)負(fù)責(zé)人5月在投資者活動(dòng)上提及,冷板產(chǎn)品門檻低于比浸沒液冷產(chǎn)品,仍處于發(fā)展初期,很多同行業(yè)公司都在進(jìn)入冷板市場(chǎng)搶奪份額,導(dǎo)致競(jìng)爭(zhēng)激烈,公司目前以搶占市場(chǎng)份額為主,長(zhǎng)遠(yuǎn)看預(yù)計(jì)毛利會(huì)改善。

編 輯:高靖宇
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
尚冰:中國(guó)互聯(lián)網(wǎng)應(yīng)用蓬勃發(fā)展,多項(xiàng)關(guān)鍵指標(biāo)位居全球第一
精彩專題
CES 2024國(guó)際消費(fèi)電子展
2023年信息通信產(chǎn)業(yè)盤點(diǎn)暨頒獎(jiǎng)禮
飛象網(wǎng)2023年手機(jī)評(píng)選
第24屆中國(guó)國(guó)際光電博覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像