Key Takeaways:
- NVIDIA Rubin 平台是首款 100% 液冷 AI 系統,使用 45°C 冷卻液
- 封閉式循環設計將用水量降至趨近於零,PUE 降至 1.15
- 一座 50 百萬瓦的設施每年可節省超過 400 萬美元的冷卻成本
Key Takeaways:

NVIDIA Rubin 架構是業界首款 100% 液冷 AI 平台,採用 45°C 冷卻液,無需風扇,並將資料中心用水量削減高達 100%。
NVIDIA Rubin 世代所使用的冷卻液溫度高達 45°C——比熱水浴缸還暖——在密封的無風扇設計中循環,將資料中心冷卻用水量降至趨近於零。對於冷卻用電佔比高達 40% 的業界而言,這是一項里程碑。
「採用乾式冷卻器的設計屬於封閉循環系統,沒有蒸發式水冷——除非在某些氣候條件下,一年中可能僅有約 1% 的時間需要啟動冷卻水機,」NVIDIA 資料中心冷卻總監 Ali Heydari 表示。
該系統將 75% 的水與 25% 的丙二醇混合冷卻液,循環通過安裝在每個處理器、網路晶片及電源元件上的冷板——徹底摒棄了前代產品的混合式氣冷與液冷並行方案。冷卻液以 45°C 進入機櫃,在吸收晶片表面熱量後,以約 55°C 排出。NVIDIA 表示,一座採用此技術的 50 百萬瓦超大規模設施,每年可在冷卻相關的能源與水費上節省超過 400 萬美元,同時將 PUE 從 1.35 降至 1.15。
Rubin NVL72 機櫃整合了 72 顆 GPU 與 36 顆 CPU,單櫃功率密度超過 100 千瓦,每套售價高達 880 萬美元。NVIDIA 股價於 6 月 19 日收在 210.69 美元,市值達 5.14 兆美元。這項冷卻創新消除了 AI 基礎設施擴張的一大關鍵瓶頸,在超大規模雲端業者嚴格審視資料中心每一瓦電力的時刻,強化了 NVIDIA 相較於 AMD 及客製化 ASIC 對手的競爭優勢。
45°C 冷卻液如何改變資料中心的物理法則
傳統資料中心依賴高耗能的冷卻水機與風扇,將冷空氣推送通過熱通道與冷通道,冷卻風扇運轉時噪音可達 85 分貝以上。NVIDIA 的做法翻轉了該模式:透過液冷冷板直接在晶片處捕捉熱量,系統可經由室外乾式冷卻器(本質上即大型散熱盤管)將熱量排出,全年絕大部分時間無需機械製冷。
地理條件是一個關鍵變數。位於氣候較涼爽地區的設施可完全無需冷卻水機運作,而鳳凰城等地的設施在最炎熱的夏日可能僅需少量啟動冷卻水機。即使在較溫暖地區,朝向 45°C 冷卻液的轉變也使營運商更接近無冷卻水機的理想狀態,冷卻水機可能每年僅需運轉數日。
Rubin 平台還在冷板中引入了微通道技術,其流道經過精密銑削、刮削、雷射加工、蝕刻或 3D 列印等技術,加工至微米級精度。華源證券分析師李澤指出,銅因其優於鋁的導熱性能,成為這類微通道冷板的首選基底材料。
供應鏈與競爭格局的漣漪效應
轉向 100% 液冷在資料中心供應鏈中引發連鎖效應。施耐德電機旗下先進冷卻部門 Motivair 與 NVIDIA 的產品路線圖合作已近十年,開發出高阻抗冷卻液配方以提升可靠性並將洩漏風險降至最低。「一旦每顆晶片的瓦數超過某個臨界點,液冷就成為必然選擇,」Motivair 總裁兼執行長 Richard Whitmore 表示。
對於正大規模建置 AI 基礎設施的雲端服務商而言,營運上的節省是實質的。採用傳統冷卻水塔系統的設施,每百萬瓦每年約消耗 260 萬加侖的水。NVIDIA 的封閉循環設計幾乎完全消除了這項消耗。廢熱回收的潛力——將 AI 工廠的餘熱重新利用,為周邊商業或住宅建築供暖——則增添了另一層價值。
作為 Blackwell 的後繼產品,NVIDIA Rubin 架構預計將驅動下一波超大規模 AI 部署。單櫃功率已超過 200 千瓦,氣冷方案在這些密度下已不再可行。包括 AMD 及日益壯大的客製化 ASIC 設計商在內的競爭對手,都必須在熱工程技術上追上 NVIDIA,才能在 AI 硬體市場保持競爭力。
NVIDIA 股價目前交易在約 35 倍預期本益比。若冷卻效率的提升能在現有安裝基礎中廣泛採用,可使超大規模雲端業者的總持有成本每年減少數億美元——這或許足以合理化 Rubin 機櫃的高昂定價,並進一步鞏固 NVIDIA 在 AI 基礎設施領域的主導地位。
本文僅供資訊參考,不構成投資建議。