華為昇騰節點全系列產品支援 DeepSeek V4 模型,Atlas 350 算力近 3 倍 H20

DeepSeek 近日發佈全新系列模型 V4 的預覽版本,並同步開源。華為亦首次表示,其昇騰節點系列產品全面支援 DeepSeek V4。根據華為官方說法,昇騰一直同步支援 DeepSeek 系列模型,此次透過雙方晶片模型技術深度協同,實現昇騰節點全系列產品支援 DeepSeek V4 系列模型。DeepSeek 在官方公告中還表示:「預計下半年昇騰 950 節點批量上市並部署之後,Pro 版本的價格也會大幅下調。

華為昇騰 950PR 與 Atlas 350 規格升級

此前,在華為中國合夥人大會 2026 上,華為重磅發佈搭載全新昇騰 950PR(Ascend 950PR)處理器的 AI 訓練推理加速卡 Atlas 350。相較前一代昇騰晶片,昇騰 950PR 在低精確度數值格式、向量算力、互聯帶寬以及自研 HBM 等方面實現大幅提升。據華為昇騰計算業務總裁娄玟艷介紹,Atlas 350 的單卡算力達到英偉達 H20 的 2.

87 倍,是目前國產唯一支援 FP4 低精確度的推理產品。此外,該晶片的 HBM(高帶寬記憶體)容量為 H20 的 1.16 倍,達到 112GB,多模態生成速度可提升 60%;記憶體存取粒度從 512 字節降低至 128 字節,小算子存取效率提升 4 倍。 在本次大會展示的 Atlas 350 展台,華為公佈的參數為:Atlas 350 的 FP4 精確度算力為 1.

56P,帶寬達到 1.4TB/s;功耗為 600W,是 H20 的 1.5 倍。Atlas 350 除支援 FP16、FP8 外,還支援更低精確度的 FP4。這意味著,集成 Atlas 350 叢集的伺服器能支援更大模型以及更低時延的推理,精確度降低,計算速度就會更快,叢集效能也會更高。華為昇騰計算業務總裁娄玟艷表示,基於 Atlas 350 等產品,結合 AI 發展趨勢與客戶需求,昇騰將打通大、中、小三大核心算力場景,助力夥伴滿足差異化場景需求,同時深入行業智能化。

| 規格項目 | Atlas 350 | 英偉達 H20 | |———-|———–|————| | FP4 精確度算力 | 1.56P | – | | 單卡算力倍數 | H20 的 2.87 倍 | – | | HBM 容量 | 112GB (H20 的 1.16 倍) | – | | 帶寬 | 1.4TB/s | – |

| 功耗 | 600W (H20 的 1.5 倍) | 400W | | 多模態生成速度提升 | 60% | – | | 記憶體存取粒度 | 128 字節 | 512 字節 | | 小算子存取效率提升 | 4 倍 | – |

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。