在當代科技界,特別是在人工智能和新能源等技術領域,技術進步正以空前的速度迅猛發(fā)展。這些領域技術發(fā)展的顯著特征是設備功率的不斷提升和體積的逐漸縮小,從而使得散熱挑戰(zhàn)日益嚴峻。隨之而來的是散熱技術的不斷創(chuàng)新,從傳統(tǒng)的風冷到冷板液冷,再到近年來復興的浸沒式液冷技術。
展望未來,浸沒式液冷技術有望成為散熱領域的主流。以下因素預示著這一趨勢:
一、業(yè)務驅動
人工智能技術的核心在于大規(guī)模數(shù)據(jù)處理和復雜算法運算,導致IT設備運算量激增,功率顯著提高。例如,NVIDIA最新發(fā)布的B200單顆GPU芯片功率已達到1000W。這種高功率密度帶來了散熱難題,因為過高的溫度會嚴重影響IT設備的性能和穩(wěn)定性,甚至可能導致硬件損壞。因此,迫切需要更高效的散熱解決方案。新能源汽車和汽車充電設備等領域也面臨著類似的挑戰(zhàn)。
二、政策驅動
在國家的科技發(fā)展戰(zhàn)略規(guī)劃中,對人工智能的發(fā)展給予了高度重視和積極推動。近年來,政府相繼頒布了一系列政策,旨在促進數(shù)據(jù)中心和智算中心的建設,以增強我國在人工智能領域的競爭力和創(chuàng)新能力。
伴隨數(shù)據(jù)中心規(guī)模的持續(xù)擴張及能耗的顯著上升,國家對數(shù)據(jù)中心和智算中心機房的建設標準提出了更為嚴格的要求。特別是,電能利用效率(PUE值——即數(shù)據(jù)中心總體能耗與IT設備能耗之比,該值越接近1表明能源利用效率越高)已成為評估數(shù)據(jù)中心能效的關鍵性能指標。根據(jù)當前的國家政策,新建數(shù)據(jù)中心的PUE值普遍需控制在1.3以下,某些地區(qū)更是提出了將PUE值降至1.2甚至1.1的更高要求。這一政策導向激勵了數(shù)據(jù)中心行業(yè)積極探索更為節(jié)能高效的散熱解決方案,從而為浸沒液冷技術的廣泛采納和應用創(chuàng)造了政策機遇。
三、需求驅動
(一)風冷的局限
風冷作為傳統(tǒng)的散熱方式,在面對日益增長的IT設備散熱需求時其局限性越來越明顯。當單CPU功率超過300W時,風冷系統(tǒng)無法有效地將熱量散發(fā)出去,導致CPU溫度過高,進而出現(xiàn)降頻現(xiàn)象,嚴重影響設備的性能。在整機柜功率達到15kW以上時,風冷系統(tǒng)同樣也會力不從心了。
(二)冷板液冷的問題
在高端功率應用場景中,風冷技術的逐步淘汰為液冷技術的高速發(fā)展提供了空間。得益于其相對較低的前期成本和較為成熟的產業(yè)鏈支持,冷板液冷技術在液冷技術路線的競爭中取得了先機,進入快速發(fā)展階段。然而,其快速發(fā)展亦暴露出若干問題:
一是節(jié)能效率提升需求。盡管冷板液冷技術在某些方面優(yōu)于風冷技術,但其節(jié)能效率仍有提升空間。該技術的最低PUE值僅能降至1.2,與國家政策標準和行業(yè)發(fā)展趨勢相比,存在顯著差距。以中等規(guī)模的數(shù)據(jù)中心為例,采用PUE值為1.2的冷板液冷系統(tǒng),相較于采用PUE值為1.1的高效散熱技術(如浸沒液冷)的數(shù)據(jù)中心,每年在電力成本上的額外支出可能高達數(shù)十萬元人民幣。
二是成本考量。冷板液冷系統(tǒng)的總體成本相對較高,一方面,冷板的設計、制造和安裝需要專業(yè)的技術支持和設備,導致初期投資成本增加。據(jù)行業(yè)分析數(shù)據(jù),冷板液冷系統(tǒng)的初始投資成本較傳統(tǒng)風冷系統(tǒng)高出30%-50%。另一方面,該系統(tǒng)的維護復雜,需要定期檢查冷卻液的泄漏情況和冷板的散熱性能,成本將會進一步增加。
三是安全性評估。第一、業(yè)務連續(xù)性安全,冷板液冷系統(tǒng)若發(fā)生冷卻液泄漏或冷板故障,可能導致服務器局部過熱或短路,今年已有多起因冷卻液泄漏導致的數(shù)據(jù)中心故障事件發(fā)生。第二、供應鏈安全,冷板液冷技術屬于定制化液冷解決方案,對服務器的匹配度要求嚴格。一旦系統(tǒng)安裝完畢,服務器與冷板液冷系統(tǒng)之間形成緊密的依賴關系。若需更換供應商,不僅需重新進行兼容性測試,還可能面臨技術改造的挑戰(zhàn),這對數(shù)據(jù)中心的供應鏈穩(wěn)定性構成潛在威脅。第三、 消防安全,隨著數(shù)據(jù)中心、鋰電池、充電設備等功率密度的提升,安全風險相應增加。在消防安全風險方面,冷板液冷系統(tǒng)仍未能提供有效的安全保障。
四、技術驅動
經過長期的積累和實踐,近兩年浸沒式液冷技術取得了突破性進展,不管是技術還是成本上,都達到了大規(guī)模實用的條件。其中,杭州京工電科技有限公司是典型的代表,其自研的浸沒液冷具有非常優(yōu)良的物理和化學屬性,可以兼容各類IT設備、鋰電池以及新能源充電設備等。更重要的是,他們的冷卻液在價格方面也已掃清了大規(guī)模商業(yè)推廣的障礙。
浸沒液冷方案是將服務器、鋰電池等硬件完全浸沒在特制的冷卻液中,冷卻液通過循環(huán)的方式將熱量帶走,然后通過熱交換模塊將熱量傳遞給外部環(huán)境。這種散熱方式具有諸多優(yōu)勢:
一是高效散熱:浸沒液冷技術通過與發(fā)熱元件的直接接觸,極大提升了熱傳遞效率。在數(shù)據(jù)中心應用中,能夠從容應對單CPU功率1000W以上、整機柜功率30kW以上的散熱需求。在新能源汽車充電樁領域,更能適應兆瓦級的超快速充電需求。
二是顯著節(jié)能:得益于其高效的散熱能力,浸沒液冷技術顯著降低了數(shù)據(jù)中心的PUE值。京工電科技已實現(xiàn)將數(shù)據(jù)中心的PUE值降至1.1以下,極大提升了運營效率。在充電樁應用中,通過將充電模塊浸入冷卻液,實現(xiàn)了97.6%的整機功率轉換效率,據(jù)公開數(shù)據(jù)顯示,這一轉換效率是行業(yè)內最高的。
三是成本控制潛力:PUE值從1.3降至1.1以下,意味著機房IT設備之外的功耗從總功率的30%降至10%以內,相應地,散熱系統(tǒng)和供電系統(tǒng)的需求減少了三分之二,整體成本顯著降低。
四是安全性保障:設備安全方面,浸沒液冷的冷卻液通常具備良好的阻燃性和化學穩(wěn)定性,顯著降低了火災風險。此外,系統(tǒng)的封閉性可有效減少外部因素導致的故障風險,確保業(yè)務的連續(xù)安全運行。在供應鏈安全方面,浸沒液冷系統(tǒng)的通用性強,供應商切換相對便捷,不會對數(shù)據(jù)中心供應鏈帶來任何風險。
綜上所述,在人工智能、新能源的發(fā)展導致各類設備散熱需求劇增的背景下,業(yè)務、政策、需求以及浸沒液冷本身技術的發(fā)展,已經使得浸沒液冷技術開始在熱管理領域重新嶄露頭角,并逐漸接管熱管理的未來,成為數(shù)據(jù)中心、智算中心、新能源等眾多領域熱管理方向的高競爭力技術方案,將對整個IT、新能源、電池等領域的可持續(xù)發(fā)展產生深遠影響。