Intel 挑戰 Nvidia H100 AI GPU,推出 Gaudi3 配備 128GB RAM

Intel 推出 Gaudi3 處理器,具備內建記憶體的 AI 加速器,挑戰 H100 這款最佳顯示卡。Gaudi3 是一款 5nm 製程的處理器,為 7nm 深度學習訓練處理器 Gaudi2 的後繼產品。據 Serve the Home 報導,Gaudi3 的腦部浮點運算能力是 BF16 的四倍,網絡能力是兩倍,頻寬則是高頻寬記憶體的 1.5 倍。

預計 Gaudi3 將於 2024 年推出,據該報導估計,該處理器將搭載高達 128GB 的 HBM3e RAM,相較於前代的 96GB HBM2e 內建記憶體,這將帶來顯著的 AI 學習和訓練性能提升。

這實際上是 Intel 對 GH200 超級芯片的回應,後者搭載了 141GB 的 HBM3e 記憶體,是 Nvidia 最新顯示卡的陪伴者。由於 Gaudi2 的性能與 H100 相近,Gaudi3 很可能在性能水平上與 H200 相當。Intel 在展示其 Gaudi3 晶片的能力時,同時展示了搭載在全新 Aurora 超級計算機中的 Intel Max 系列 1550 顯示卡。這是第二台 exascale 超級計算機,一旦完全調校,很可能成為有史以來最強大的計算機。

預計它在性能上將超越 Frontier 超級計算機,達到高達 2 exaFLOPs 的水平,即每秒約兩千億億次計算。根據該公司的說法,相較於搭載 AMD 和 Nvidia 顯示卡的可比系統,它在處理 AI 訓練工作負載方面具有更強大的能力。

在 CosmicTagger 單 GPU 訓練吞吐量基準測試中,Intel Max 1550 GPU 的得分為 48.4 samples per second,而 AMD 的 MI250 和 Nvidia 的 A100 則分別為 31.2 和 14.7。在 CosmicTagger 單節點訓練基準測試中,Intel 的 GPU 的得分為 280 samples per second,而 AMD 和 Nvidia 的 GPU 則分別為 120 和 54.9。

雖然目前沒有 Nvidia 的 H100 或 H200 顯示卡的可比基準測試數據,但這些結果使得 Intel Max 1550 成為運行 AI 訓練和推理工作負載的非常出色的選擇。

此文章發佈於 TechRitual 香港