Nvidia 剛剛宣佈推出 RTX Spark 一款新型 AI 伺服器技術,這將逐漸進入消費者市場,搭載 Grace CPU(20 核心)、Blackwell GPU(6,144 CUDA 核心)及 128GB 的 LPDDR5X 記憶體。接下來的伺服器技術以及未來可能的消費者設備也將隨之而來。新推出的 Vera CPU 是 Vera Rubin 平台的 CPU 部分,另一部分為 Rubin GPU。
Vera 提供比「領先的 x86 CPU」平均快 1.8 倍的性能(Nvidia 並未具名這些 CPU)。Vera 的規模相當龐大,擁有 88 個 Olympus 核心(基於 ARM 指令集),並具備空間多線程技術,可以在每個插槽上支持 176 條線程。
Nvidia Vera CPU 將成為未來 AI 伺服器的核心技術
該處理器最多可搭配 1.5TB 的 LPDDR5X RAM,提供高達 1.2TB/s 的帶寬,這對於 AI 推理至關重要。Vera 可以作為獨立的 CPU 用於自主 AI 工作負載、增強學習、數據處理及分析。此外,Nvidia 還設計了 Vera CPU 機架,該機架最多可容納 256 顆 CPU,提供 22,528 核心和 45,056 條線程。或者,Vera 也可以作為主機 CPU 與 Rubin GPU 配合使用。
例如,NVIDIA Vera Rubin NVL72 配備 36 顆 Vera CPU 和 72 顆 Rubin GPU。CPU 和 GPU 之間可以通過 Nvidia NVLink-C2C 互連以 1.8TB/s 的速度進行通信。
Nvidia 已經獲得了重要客户,包括 Anthropic(Claude)、OpenAI(ChatGPT)和 SpaceXAI(Grok),這些客户將使用 Vera CPU,還有一些大型雲服務提供商,如 ByteDance、CoreWeave 和 Oracle Cloud Infrastructure。此外,Dell、HP、Lenovo 和 Supermicro 也將構建獨立的 Vera CPU 系統。
其他合作伙伴還包括華碩、仁寶、富士康、技嘉、和碩、廣達雲端科技、緯創和 Wiwynn。甚至紐約證券交易所也表現出興趣,因為該交易所每天處理 1.1 兆條消息,因此正在與 Redpanda 和 HP 合作建設新的基礎設施。
項目 規格 處理器 Vera CPU(20 核心) RAM 最多 1.5TB LPDDR5X 帶寬 高達 1.2TB/s GPU Rubin GPU(72 顆) CPU 核心數 最多 256 顆 線程數 最多 45,056 條
📬 免費訂閱 TechRitual 科技精選
按「免費訂閱」即同意收到 TechRitual 嘅科技資訊及優惠。可隨時取消訂閱。

