華為昇騰節點全系列產品支援 DeepSeek V4 模型，Atlas 350 算力近 3 倍 H20

DeepSeek 近日發佈全新系列模型 V4 的預覽版本，並同步開源。華為亦首次表示，其昇騰節點系列產品全面支援 DeepSeek V4。根據華為官方說法，昇騰一直同步支援 DeepSeek 系列模型，此次透過雙方晶片模型技術深度協同，實現昇騰節點全系列產品支援 DeepSeek V4 系列模型。DeepSeek 在官方公告中還表示：「預計下半年昇騰 950 節點批量上市並部署之後，Pro 版本的價格也會大幅下調。

」

華為昇騰 950PR 與 Atlas 350 規格升級

此前，在華為中國合夥人大會 2026 上，華為重磅發佈搭載全新昇騰 950PR（Ascend 950PR）處理器的 AI 訓練推理加速卡 Atlas 350。相較前一代昇騰晶片，昇騰 950PR 在低精確度數值格式、向量算力、互聯帶寬以及自研 HBM 等方面實現大幅提升。據華為昇騰計算業務總裁娄玟艷介紹，Atlas 350 的單卡算力達到英偉達 H20 的 2.87 倍，是目前國產唯一支援 FP4 低精確度的推理產品。此外，該晶片的 HBM（高帶寬記憶體）容量為 H20 的 1.16 倍，達到 112GB，多模態生成速度可提升 60%；記憶體存取粒度從 512 字節降低至 128 字節，小算子存取效率提升 4 倍。在本次大會展示的 Atlas 350 展台，華為公佈的參數為：Atlas 350 的 FP4 精確度算力為 1.56P，帶寬達到 1.4TB/s；功耗為 600W，是 H20 的 1.5 倍。Atlas 350 除支援 FP16、FP8 外，還支援更低精確度的 FP4。這意味著，集成 Atlas 350 叢集的伺服器能支援更大模型以及更低時延的推理，精確度降低，計算速度就會更快，叢集效能也會更高。華為昇騰計算業務總裁娄玟艷表示，基於 Atlas 350 等產品，結合 AI 發展趨勢與客戶需求，昇騰將打通大、中、小三大核心算力場景，助力夥伴滿足差異化場景需求，同時深入行業智能化。

| 規格項目 | Atlas 350 | 英偉達 H20 | |———-|———–|————| | FP4 精確度算力 | 1.56P | – | | 單卡算力倍數 | H20 的 2.87 倍 | – | | HBM 容量 | 112GB (H20 的 1.16 倍) | – | | 帶寬 | 1.4TB/s | – |

| 功耗 | 600W (H20 的 1.5 倍) | 400W | | 多模態生成速度提升 | 60% | – | | 記憶體存取粒度 | 128 字節 | 512 字節 | | 小算子存取效率提升 | 4 倍 | – |

華為昇騰節點全系列產品支援 DeepSeek V4 模型，Atlas 350 算力近 3 倍 H20

華為昇騰 950PR 與 Atlas 350 規格升級

Henderson

搜尋文章

華為昇騰 950PR 與 Atlas 350 規格升級

相關文章

Henderson

搜尋文章