DeepSeek V4 發佈支援 100 萬字上下問文 API 中國定價低企

DeepSeek 官方發佈 V4 系列模型。DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 兩款模型現已開源，用戶可即日登入官方網站或 App 體驗最新 DeepSeek-V4 對話功能，探索 1M（百萬）字元長度上下文化的全新體現。API 服務同步更新。根據官方基準測試，在上下文長度、知識、推理及 Agent 等能力上，DeepSeek V4 性能比肩國際頂級閉源模型，達到國內開源模型一流水準。

業界人士指出，在 API 調用價格上，DeepSeek V4 再次推出行業「最低價」，儘管每百萬 Tokens 調用價格未大幅下調，但長上下文及出色性能令其極具競爭優勢。

模型規格與基準測試

模型	總參數	激活性參數	預訓練數據量	上下文長度
DeepSeek-V4-Pro	1.6T	49B	33T	100 萬 token
DeepSeek-V4-Flash	284B	13B	32T	100 萬 token

DeepSeek 官方介紹顯示，V4 系列在知識與推理測試中表現出色。DeepSeek-V4-Pro-Max 在 Apex Shortlist 和 Codeforces 測試中取得最佳性能，超越 Claude Opus-4.6-Max、GPT-5.4-xHigh 和 Gemini-3.1-Pro-High 等國際模型，展現強大邏輯與算法能力；在 SimpleQA Verified 測試中略勝 Gemini-3.1-Pro-High，並領先 Claude 和 GPT。在 Agentic 能力評測中，V4 與 Opus-4.6、Gemini-3.1-Pro 在 SWE Verified 任務上打成平手，並在 Toolathlon 任務超越 GPT-5.4-xHigh，在 Terminal Bench 2.0 上優於 Opus-4.6，顯示複雜指令執行與工具調用優勢。目前 DeepSeek-V4 已成為公司內部 Agentic Coding 模型，反饋體驗優於 Sonnet 4.5，代碼質量接近 Opus 4.6 非思考模式。在數學、STEM 及競賽型編碼評測中，DeepSeek-V4-Pro 超越絕大多數已公開開源模型，取得比肩全球頂級閉源模型成績。在知識處理與推理能力上，DeepSeek-V4 取得比國內開源模型全方位領先，相當國際測試水準。但在 Agentic 能力方面，雖有不錯提升，與國內及國際第一梯隊仍有競爭空間。「標配」100 萬上下文，價格「王者」回歸。

相對於各項基準測試中的性能優勢，V4 發佈最大特色在於長文能力突破及 API 調用價格進一步下探。得益於 DeepSeek-V4 開創的全新注意力機制，透過 token 維度壓縮並結合 DSA（DeepSeek Sparse Attention），實現全球領先長上下文能力，且大幅降低計算與顯存需求，將 1M（一百萬）上下文變為所有官方服務標配。一年前，百萬上下文仍是 Gemini 獨家王牌，即便近期發佈多款國內開源模型，上下文長度多位於 128K—200K 區間，而 DeepSeek 直接將百萬

上下文從「高端閉源功能」變為開源標配。在 API 價格上，相比 GLM-5.1 輸入單價 RMB¥1.30 (約 HK$1) – RMB¥2 (約 HK$2) / 百萬 Tokens（緩存命中）及 Kimi-K2.6 RMB¥1.10 (約 HK$1) / 百萬 Tokens（緩存命中），DeepSeek-V4-Pro 和 Flash 輸入單價分別為 RMB¥1 (約 HK$1) / 百萬 Tokens 和 RMB¥0.20 (約 HK$0) / 百萬 Tokens，雖價格降幅不大但均為最低，且上下文長度擴展數倍。

模型系列	輸入單價 (元人民幣 / 百萬 Tokens, 緩存命中)
DeepSeek-V4 系列	Pro: 1 / Flash: 0.2
Kimi-K2.6	1.1
GLM-5.1	1.3 – 2

業界人士認為，DeepSeek-V4 性能突破相對 DeepSeek-R1 發佈時衝擊小了些，各項性能依舊處第一梯隊，但領先優勢未完全拉開。此次 V4 更在長文能力提升及價格進一步下探。該人士感嘆：「之前 DeepSeek-V3 及 R1 發佈後，透過底層技術創新帶來性能優勢，直接推動整個國內大模型行業集體降價，雖 V4 每百萬 Tokens 價格未下太多，但仍有競爭力，那個大模型價格王者又回來了！

」值得留意的是，在 DeepSeek-V4 官方 API 價格資訊最下方，特別註明：「受限高端算力，目前 Pro 服務吞吐量有限，預計下半年華為昇騰 950 算點量產上市後，Pro 價格會大幅下調。」這意味 V4 系列已針對華為昇騰 950 完成適配，只要昇騰 950 上市，用戶即可基於國產算力享用比肩國際頂級閉源模型的 DeepSeek-V4。官方開源技術文檔中，DeepSeek 亦提到此點，直言 V4 已於 NVIDIA GPU 和華為 Ascend NPU 平台驗證細粒度 EP（專用並

行）方案，相對於強融合基線，在通用推理任務上實現 1.50-1.73 倍加速效果，而在對延遲敏感場景（如 RL 推演及高速代理服務）中可達 1.96 倍加速。V4 發佈後，華為昇騰同步宣布「算點全系列產品支持 DeepSeek V4 系列模型」。據悉，昇騰 950 透過融合 kernel 和多卡並行技術降低 Attention 計算與存取開銷，大幅提升推理性能，結合多種量化算法，實現高吞吐、低延遲的 DeepSeek V4 模型推理部署。

本月上旬，OpenAI 創始人黃仁勳在接受 Dwarkesh Patel 專訪時曾言：「如果 DeepSeek 先在華為平台發佈，那對我們國家（美國）來說將是挑戰性。」在黃仁勳眼中，DeepSeek 作為開源模型，同樣可用於 OpenAI 產品，但若 DeepSeek 專門針對華為算力優化，在高端算力受限等局勢下，OpenAI 將處不利。現況顯示，DeepSeek 亦針對 OpenAI 算力進行 EP 方案驗證，但黃仁勳擔心的仍發生了。

業界人士看來，「V4 是算力博弈產物，未來一年，國產大模型將在國產卡上逐漸成勢。」比較遺憾的是，DeepSeek V4 雖發佈，但該版本仍是純文字模型，無太多文生圖、文生視頻等多模態能力。這也讓普通用戶快速體驗評測一模型，平添不小難度。在大語言模型能力不斷提升、幻覺率逐步降低當下，常規、單一的知識問答已難客觀反差一模型綜合能力。對多數用戶而言，想直觀感受 V4 模型能力，得下載自行用上雲端。

V4 系列模型發佈同時，近期 DeepSeek 傳出融資 500 億元人民幣消息，有接近 DeepSeek 知情人士透露，融前估值 3000 億元人民幣，約 US$384 (約 HK$2,995) 億，目前百度、阿里雲集團均在洽談投資 DeepSeek。惟對融資相關事宜，DeepSeek 方至今未正式回應媒體查詢。或許，對 DeepSeek 創始人梁文峰而言，在全球大模型「智力」增長放緩、行業人才競爭加劇、行業多模態化、Agentic 化趨勢不斷凸顯環境下，借 V4 發佈適時融資源實力，亦不失為明

智之舉。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

DeepSeek V4 發佈支援 100 萬字上下問文 API 中國定價低企

模型規格與基準測試

Henderson

搜尋文章

模型規格與基準測試

相關文章

Henderson

搜尋文章