1月15日,華為舉辦2024數(shù)據中心能源十大趨勢發(fā)布會并發(fā)布《白皮書》。發(fā)布會上,華為數(shù)據中心能源領域總裁堯權定義未來數(shù)據中心的三大特征:安全可靠、融合極簡、低碳綠色,并分享數(shù)據中心在部件、產品、系統(tǒng)和架構方面的技術演進趨勢,凝聚共識,洞見未來。
華為數(shù)據中心能源領域總裁堯權
堯權表示,AI大模型時代,未來5年全球AI算力年復合增長率超過80%,數(shù)據中心逐步從云數(shù)據中心向云+智算中心演進。華為基于深刻洞察和長期實踐,面向全球發(fā)布2024數(shù)據中心能源十大趨勢,與業(yè)界分享華為對未來數(shù)據中心的洞見和思考。
據Uptime權威數(shù)據,從2019年到2022年,數(shù)據中心業(yè)務中斷損失超過10萬美金的比例,已經從39%上升至71%,且會隨著算力需求翻番成倍增長。毫無疑問,安全可靠是數(shù)據中心最核心需求,應始終作為最高優(yōu)先級關注。
趨勢1:高可靠產品+專業(yè)化服務是保障數(shù)據中心安全可靠運行的關鍵
數(shù)據中心承載海量數(shù)據的存儲、處理和傳輸,為千行百業(yè)堅定運行提供保障,而數(shù)據中心的安全性、可靠性一直是較薄弱的環(huán)節(jié)。為確保數(shù)據中心的安全可靠運行,在產品設計、生產環(huán)節(jié)就要貫穿“全鏈安全”的理念,同時嚴控產線質量,高度自動化,減少人為干預,保障產品自身的高可靠性。此外,要大膽假設,充分考慮產品出現(xiàn)問題后的應對措施,通過提供專業(yè)化部署和運維服務,降低產品失效率,最小化災后影響,完善端到端的保障機制,雙管齊下保障數(shù)據中心安全可靠運行。
趨勢2:分布式制冷架構將成為溫控安全的更優(yōu)選擇
傳統(tǒng)大型數(shù)據中心多采用集中式制冷架構的方案,如傳統(tǒng)冷凍水系統(tǒng),冷凍站中涉及七大子系統(tǒng)和幾十種設備,各設備之間不能獨立運行,一旦發(fā)生單點故障,可能會影響整個冷凍站的安全運行,導致數(shù)據中心大規(guī)模宕機,近年來業(yè)內部分數(shù)據中心安全事故也說明集中式制冷架構存在單點故障的風險。相較之下,分布式制冷架構靈活,各個子系統(tǒng)相互獨立,單臺設備故障不會影響其他設備運行,故障域更小,可靠性更高,可以直接從架構設計上避免數(shù)據中心制冷系統(tǒng)的單點故障,提升數(shù)據中心的運行可靠性。
趨勢3:預測性維護將成為數(shù)據中心基礎設施的標配
數(shù)據中心的維護往往是事后型,發(fā)生事故后才知道問題所在,但隨著智算時代的到來,數(shù)據中心的故障響應時間大幅縮短。未來數(shù)據中心基礎設施的運維,預測性維護將成為標配,從事后型轉為事前型。得益于AI技術的快速發(fā)展,預測性維護的范圍將持續(xù)擴大,從電容、風扇等易損件的壽命預測、設備的熱失控預警到制冷系統(tǒng)的漏液預警,都能提前預測,提前處理避免事故的發(fā)生,做到“治未病”,從被動“救火”走向主動“防火”,在運維方面大幅提升數(shù)據中心可靠性。
趨勢4:全生命周期的網絡安全防護體系將成為數(shù)據中心基礎設施的保護盾
隨著數(shù)字化、智能化程度的加深,網絡安全風險也在成倍增加,網絡攻擊越來越常態(tài)化。不管是UPS還是空調設備,一旦遭遇惡意攻擊,都會直接影響數(shù)據中心安全可靠性。未來數(shù)據中心基礎設施,硬件安全加軟件安全,才是全方位的安全,軟件安全要從供應安全、縱深防御和運維/運營安全三個維度,構筑全生命周期網絡安全防護體系,為數(shù)據中心的安全可靠運行保駕護航。
趨勢5:預制化、模塊化將成為高質量快速交付的最佳選擇
互聯(lián)網云廠商全球業(yè)務加速發(fā)展,帶動數(shù)據中心建設需求顯著增長。而傳統(tǒng)的數(shù)據中心建設模式,建設速度慢,工程復雜,不能滿足快速部署的要求。因此,建設周期更短、質量更高的預制化、模塊化方案將成為首選。通過“工程產品化”和“產品模塊化”,在工廠一體化集成,完成預制和預調試,保證現(xiàn)場交付的是高質量產品,有效縮短交付周期,同時滿足客戶業(yè)務快速上線需求,還大幅減少現(xiàn)場施工造成的“三廢”垃圾。
趨勢6:專業(yè)化管理平臺讓數(shù)據中心運維更安全、更高效
從千柜級建筑到萬柜級園區(qū),數(shù)據中心呈現(xiàn)規(guī)模化、集約化發(fā)展趨勢,相應的整體運維復雜度也大幅提升,且數(shù)據中心設備多為“啞”設備,依賴傳統(tǒng)巡檢難度大,對技能的要求較高,故障定位時間長。構建專業(yè)化的管理平臺,可以顯著提升數(shù)據中心運維效率和準確性,通過原廠的專業(yè)化管理平臺, 幫助客戶構建設備深度管理能力,大大降低運維難度,做到快速判斷問題,及時排除故障,確保數(shù)據中心安全穩(wěn)定運行。
趨勢7:風液融合將成為業(yè)務需求不確定場景下的優(yōu)選架構
當前正處于通用算力和智能算力的過渡期,同一個數(shù)據中心會同時存在通用算力和智能算力場景。通用服務器單柜功率密度一般不超過15kW,風冷型設備即可滿足制冷需求,而智算中心單柜功率密度通常超過30kW,這種場景往往需要液冷來散熱。對于需求不確定的業(yè)務場景,風液融合將成為適配未來演進的數(shù)據中心優(yōu)選架構,通過風冷+液冷的組合和比例可調,靈活適應業(yè)務需求變化,保護用戶投資。
趨勢8:間接蒸發(fā)冷依然是現(xiàn)在和未來最優(yōu)的制冷方案
當前風冷方案仍占據主流應用場景,在冷源側,間接蒸發(fā)冷卻方案相較冷凍水系統(tǒng),在架構、效率和運維方面存在明顯優(yōu)勢,是現(xiàn)在和未來最經濟適用的制冷方案。間接蒸發(fā)冷卻的分布式制冷架構可有效避免單點故障,可靠性更高;并且通過最大化利用自然冷源,僅需一次熱交換,在寒冷地區(qū)絕大部分時間無需壓縮機制冷,實現(xiàn)極致PUE;針對智能算力需求,間接蒸發(fā)冷卻支持未來演進的架構,進一步適配液冷的計算場景。
趨勢9:能效PUE挖潛要從關注部件高效調整為系統(tǒng)工程最優(yōu)解
“碳中和”是全球共識和使命,傳統(tǒng)數(shù)據中心關注提升UPS、空調等部件效率,但受限于元器件物理限制,部件的效率提升接近瓶頸,微小改進的時間和成本遠趕不上算力時代需求。因此,數(shù)據中心能效的提升要轉換思路,從關注部件效率轉為系統(tǒng)工程優(yōu)化,用系統(tǒng)工程思維綜合審視,在現(xiàn)實條件和部件技術水平進行權衡,得出最優(yōu)解,如UPS雙變換模式轉向S-ECO、數(shù)據中心PUE轉向PFPUE(算力PUE),端到端的進行數(shù)據中心能效優(yōu)化。
趨勢10:AI調優(yōu)將成為存量DC能效智能優(yōu)化的最佳選擇
在數(shù)據中心節(jié)能方面,除了新建的數(shù)據中心,仍有大量存量數(shù)據中心PUE遠高于“國家一體化大數(shù)據中心”政策要求,面臨節(jié)能改造的迫切需求。傳統(tǒng)的節(jié)能改造需要停線停業(yè)務,存在業(yè)務中斷的風險,而采用人工調整優(yōu)化的方式,難度大,效果差,頻率低。相較之下,AI能效調優(yōu)解決方案通過預置AI算法和大數(shù)據模型,可對存量數(shù)據中心實現(xiàn)節(jié)能優(yōu)化,且AI調優(yōu)不依賴人工經驗,優(yōu)化速度快,效果好,實現(xiàn)從“制冷”到“智冷”的轉變。
根深才能葉茂,本固方得枝榮。數(shù)據中心產業(yè)三十年磨一劍,為數(shù)字經濟構筑堅實底座。智能算力的爆發(fā),為數(shù)據中心產業(yè)開辟一片汪洋大海。展望未來,華為數(shù)據中心能源堅持打造安全可靠、融合極簡、低碳綠色的產品解決方案,助力客戶、伙伴構筑綠色可靠算力底座,讓每一瓦特承載更多算力,讓數(shù)字世界堅定運行。
欲了解詳細信息,請單擊鏈接查看《2024數(shù)據中心能源十大趨勢白皮書》:https://digitalpower.huawei.com/attachments/index/dde142a639e64e3696392e190649d301.pdf