微軟最近宣佈了一系列專門用於支援人工智能(AI)工作負載的新數據中心,其中包括位於威斯康辛州的「Fairwater」設施,這是其有史以來「最大且最先進的 AI 工廠」。該設施是美國正在建設的幾個相同數據中心中的第一個。除了威斯康辛州,微軟還透露計劃在挪威納維克建設一個超級規模的 AI 數據中心,並與 nScale 和 Aker 合作。在英國,微軟將與 nScale 合作建設該國最大的超級計算機。根據微軟的說法,這些設施的投資總額達到數百億美元,並且在全球超過 400 個數據中心中配備了數十萬顆尖端的 AI 芯片。
Fairwater 數據中心位於 Mt. Pleasant,佔地 315 英畝,擁有三座總面積達 120 萬平方英尺的建築。微軟表示,該項目需要 46.6 英里深基礎樁、2650 萬磅鋼材和 120 英里的地下電纜。與傳統數據中心不同,Fairwater 被構建為「一個巨大的 AI 超級計算機」,由數十萬顆 NVIDIA GPU 提供支持。根據公司的部落格文章,Fairwater 將提供「當今世界上最快超級計算機的十倍性能」。這一聲明雖然引人注目,但也突顯了微軟在高性能計算競賽中的雄心,這對 AI 的發展至關重要。
該設施的架構採用了 NVIDIA GB200 伺服器,這些伺服器以大型集群的形式互連,以便進行並行 AI 訓練。每個機架包含 72 顆 GPU,通過 NVLink 連接,提供高帶寬通信並在芯片之間共享內存。微軟表示這種配置使集群能夠每秒處理高達 865,000 個標記。未來在挪威和英國的網站預計將使用 NVIDIA 即將推出的 GB300 芯片。微軟認為其設計確保了 AI 模型可以在前所未有的規模下進行訓練。公司在部落格中聲稱:「通過與行業合作夥伴共同設計全堆疊,微軟建造了世界上最強大、最緊密耦合的 AI 超級計算機。」威斯康辛數據中心還採用了兩層布局,以減少機架之間的物理距離,從而最小化網絡延遲。
考慮到巨大的計算密度,Fairwater 使用閉環液體冷卻系統,而不是傳統的空氣冷卻。微軟表示,該系統「確保零水浪費」,在初始填充後液體會不斷循環利用。該設施由全球最大的水冷冷卻機組之一提供支持。在存儲方面,微軟重新設計了 Azure Blob Storage,以支持每個帳戶超過 200 萬次交易每秒。公司表示,這消除了手動分片的需要,並支持達到 exabyte 級別的工作負載。微軟首席執行官 Satya Nadella 在 X 平台上強調了該項目的重要性。他表示:「如果智能是計算的日誌,那麼它始於大量計算!這就是為什麼我們正在比其他任何人更快地擴展我們的 GPU 隊伍。」他補充道,Fairwater 是「數十萬顆 NVIDIA GB200 的無縫集群,連接的光纖足以繞地球 4.5 圈。」Nadella 也強調了可持續性努力,指出該設施使用可再生能源並與當地社區合作。微軟表示,類似的數據中心正在全球超過 70 個地區建設,威斯康辛州將作為未來 AI 基礎設施的模型。




