當AI算力進入萬卡規(guī)模,數(shù)據(jù)中心最令人頭疼的問題已經(jīng)從“算得不夠快”,變成了“熱得散不掉”。作為連接一切算力的核心網(wǎng)絡(luò),交換機的散熱能力,直接決定了整個AI集群的穩(wěn)定性與上線時間。傳統(tǒng)風冷已觸達極限,液冷已是必然選擇。當前,以英偉達Rubin平臺為代表的頂尖AI算力,正將“高溫”液冷確立為下一代綠色數(shù)據(jù)中心的散熱標準。這預示著,構(gòu)建端到端的高溫液冷系統(tǒng)已成為產(chǎn)業(yè)共識。但真正的挑戰(zhàn)在于:如何讓液冷做到和供電一樣可靠,成為運維團隊心中無需擔憂的默認配置,而非需要額外維護的“血液循環(huán)系統(tǒng)”?
答案很明確:用可量化、可驗證的工程實踐,重新定義可靠。新華三基于其已集成液冷設(shè)計、并經(jīng)過大規(guī)模部署驗證的新華三S9827系列800G交換機平臺,通過持續(xù)創(chuàng)新,已將液冷打磨為一項成熟可靠的關(guān)鍵底座技術(shù)。這并非簡單地為交換機加上冷板,而是一場從部件到整機的系統(tǒng)性重構(gòu)——它采用風液混合散熱架構(gòu),實現(xiàn)了對MAC、光模塊等核心熱源的精準液冷覆蓋,并以風冷作為系統(tǒng)級散熱補充。這一設(shè)計以實測數(shù)據(jù)為驗證,旨在為萬卡智算集群注入可衡量、可信任的“冷靜”基因。
圖1 H3C S9827系列數(shù)據(jù)中心交換機
自適應(yīng)貼合:攻克高功率光模塊均溫難題
對于運維工程師而言,部署高功率高密度液冷交換機的首要挑戰(zhàn),是確保核心器件不超溫。隨著QSFP-DD等高速光模塊封裝日益緊湊,其熱流密度急劇攀升。當64個這樣的高熱源緊密部署時,第一道門檻是必須通過高效熱量導出,將每一個端口的溫度都“壓”到安全閾值以下。在此基礎(chǔ)之上,如何在長期運行、多次插拔及復雜裝配公差下,保障所有端口散熱效能的高度一致與穩(wěn)定,則是決定系統(tǒng)能否大規(guī)??煽可逃玫母顚犹魬?zhàn)。
針對這一挑戰(zhàn),H3C S9827系列交換機帶來了全新“自適應(yīng)貼合”液冷架構(gòu)。其核心是獨有的專利硬管雙重浮動技術(shù)。該技術(shù)通過冷板與管路的協(xié)同微浮動,能主動吸收并補償光模塊的所有微觀偏差。實測驗證,在滿負載業(yè)務(wù)流量下,所有光模塊殼體溫度均穩(wěn)定在安全閾值以內(nèi),且64個端口的溫度保持高度一致,差異可控制在5℃以內(nèi)。這一優(yōu)異表現(xiàn)的根源在于,該專利設(shè)計確保了所有端口冷板的接觸熱阻高度一致,從而實現(xiàn)了每一個端口的零間隙緊密貼合與高效散熱,從根源上杜絕了因接觸不良導致的散熱不均。
圖2“自適應(yīng)貼合”液冷架構(gòu)
此項創(chuàng)新,直接攻克了因公差和插拔導致的接觸熱阻高與散熱不均痼疾??蛻魺o需再為結(jié)構(gòu)尺寸和裝配公差或插拔導致的接觸不良而擔憂,更能讓每個端口都獲得散熱效能一致、溫度可控的確定性保障,將散熱風險徹底轉(zhuǎn)化為可信賴的基礎(chǔ)能力。
液電物理隔離:筑牢液冷本質(zhì)安全根基
解決了散熱的問題,更大的心結(jié)在于安全性。對數(shù)據(jù)中心管理者而言,引入液冷的首要顧慮永遠是“漏液”。傳統(tǒng)的安全思路是在關(guān)鍵位置安裝漏液傳感器進行事后報警,這本質(zhì)上屬于被動補救。H3C S9827系列交換機致力于構(gòu)建“本質(zhì)安全”。其核心是貫徹徹底的液電物理隔離原則。這通過三重純粹的物理防線來實現(xiàn):首先,在源頭采用一體化成型全金屬硬管,徹底取消了所有易老化的密封圈和薄弱焊接點,從根源上消滅泄漏隱患。其次,在整機架構(gòu)上,通過嚴格的液電物理分區(qū)布局,確保散熱液體流經(jīng)的路徑與關(guān)鍵電路區(qū)域?qū)崿F(xiàn)物理隔離,形成明確的安全邊界。最后,即便在極端情況下,精密設(shè)計的導流集液盤系統(tǒng)也能確保液體被100%截留并安全導出,在結(jié)構(gòu)上徹底封堵了液電接觸的任何可能。
圖3 液電物理隔離
這套以液電隔離為基石的體系,經(jīng)過了嚴格的冗余度與可靠性驗證,將液冷從一項需要7x24小時緊盯、隨時準備應(yīng)急的“風險項”,轉(zhuǎn)變成了天生可靠、無需維護的安全資產(chǎn)。
高密度集成:兌現(xiàn)數(shù)據(jù)中心TCO與能效雙重回報
傳統(tǒng)散熱是高密度部署的瓶頸,迫使設(shè)計在體積與性能間妥協(xié)。H3C S9827系列交換機的液冷技術(shù),則扭轉(zhuǎn)了這一邏輯,將其從限制因素轉(zhuǎn)化為實現(xiàn)極限集成的核心使能技術(shù)。
前兩大創(chuàng)新設(shè)計,最終實現(xiàn)了系統(tǒng)級的高密度與高能效。其直接成果是:H3C S9827系列在緊湊的機箱空間內(nèi),穩(wěn)定部署了64個800G端口,實現(xiàn)了對傳統(tǒng)密度極限的突破。這一由液冷賦能的高密度形態(tài),成為釋放價值的核心杠桿。
圖4 系統(tǒng)級成果
首先,它重構(gòu)了成本體系。超高的單機端口密度,直接大幅減少了構(gòu)建大規(guī)模智算集群所需的交換機與互聯(lián)線纜總量,降低了采購成本。同時,更少的設(shè)備與線纜帶來了網(wǎng)絡(luò)拓撲的簡化與潛在故障點的減少,從根本上降低了長期運維的復雜性與風險成本。
其次,它重塑了綠色競爭力。這一競爭力源于從設(shè)備到機房的系統(tǒng)性能效革新。
在設(shè)備端,其效能源于精密的液冷設(shè)計:冷板內(nèi)部的精密流道,使冷卻液按需流向MAC芯片等熱源,實測數(shù)據(jù)表明,該設(shè)計使關(guān)鍵芯片的結(jié)溫較同配置風冷方案降低超過10℃。在此基礎(chǔ)上,液冷承擔主要散熱負荷,使風扇系統(tǒng)得以精簡(數(shù)量減少、轉(zhuǎn)速降低),最終實現(xiàn)整機功耗降低11%、運行噪音削減23dB的顯著優(yōu)化。
在機房側(cè),系統(tǒng)支持40℃高溫液冷,正是構(gòu)成上述端到端高溫液冷系統(tǒng)的關(guān)鍵一環(huán)。它使得交換機不僅能直接利用自然冷源或余熱回收,更能與服務(wù)器側(cè)液冷系統(tǒng)高效協(xié)同。高效散熱使空調(diào)制冷需求銳減,單臺設(shè)備年節(jié)電約7000度,推動數(shù)據(jù)中心PUE值降至1.2 以下。
最終,這項使能技術(shù)的價值被重新定義:它不再是一項被動的散熱成本,而是能夠從采購、運營到能源多個維度,撬動更大節(jié)約、從而顯著優(yōu)化數(shù)據(jù)中心總體擁有成本的高回報投資。在“雙碳”戰(zhàn)略背景下,這項直接降低PUE、提升能效的技術(shù),也成為了構(gòu)建綠色數(shù)據(jù)中心、響應(yīng)國家戰(zhàn)略的關(guān)鍵一環(huán)。
新華三S9827系列交換機的液冷突破,勾勒出一條從技術(shù)到價值的轉(zhuǎn)化路徑:在部件層解決了高功率光模塊散熱難題,在設(shè)備層實現(xiàn)了基于液電隔離的本質(zhì)安全,最終在系統(tǒng)集成層,將超高密度與極致能效轉(zhuǎn)化為確定的商業(yè)回報。這層層遞進的確定性工程,共同鑄就了智算時代網(wǎng)絡(luò)核心所需的 “冷靜”基因 。它不僅是一項散熱技術(shù),更是面向AI算力爆發(fā)時代,對數(shù)據(jù)中心核心網(wǎng)絡(luò)設(shè)備可靠性、可用性與經(jīng)濟性的一次系統(tǒng)性重定義。