DeepSeek 官方發佈 V4 系列模型。DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 兩款模型現已開源,用戶可即日登入官方網站或 App 體驗最新 DeepSeek-V4 對話功能,探索 1M(百萬)字元長度上下文化的全新體現。API 服務同步更新。根據官方基準測試,在上下文長度、知識、推理及 Agent 等能力上,DeepSeek V4 性能比肩國際頂級閉源模型,達到國內開源模型一流水準。
業界人士指出,在 API 調用價格上,DeepSeek V4 再次推出行業「最低價」,儘管每百萬 Tokens 調用價格未大幅下調,但長上下文及出色性能令其極具競爭優勢。
模型規格與基準測試
| 模型 | 總參數 | 激活性參數 | 預訓練數據量 | 上下文長度 |
|---|---|---|---|---|
| DeepSeek-V4-Pro | 1.6T | 49B | 33T | 100 萬 token |
| DeepSeek-V4-Flash | 284B | 13B | 32T | 100 萬 token |
DeepSeek 官方介紹顯示,V4 系列在知識與推理測試中表現出色。DeepSeek-V4-Pro-Max 在 Apex Shortlist 和 Codeforces 測試中取得最佳性能,超越 Claude Opus-4.6-Max、GPT-5.4-xHigh 和 Gemini-3.1-Pro-High 等國際模型,展現強大邏輯與算法能力;在 SimpleQA Verified 測試中略勝 Gemini-3.
1-Pro-High,並領先 Claude 和 GPT。在 Agentic 能力評測中,V4 與 Opus-4.6、Gemini-3.1-Pro 在 SWE Verified 任務上打成平手,並在 Toolathlon 任務超越 GPT-5.4-xHigh,在 Terminal Bench 2.0 上優於 Opus-4.6,顯示複雜指令執行與工具調用優勢。目前 DeepSeek-V4 已成為公司內部 Agentic Coding 模型,反饋體驗優於 Sonnet 4.
5,代碼質量接近 Opus 4.6 非思考模式。在數學、STEM 及競賽型編碼評測中,DeepSeek-V4-Pro 超越絕大多數已公開開源模型,取得比肩全球頂級閉源模型成績。 在知識處理與推理能力上,DeepSeek-V4 取得比國內開源模型全方位領先,相當國際測試水準。但在 Agentic 能力方面,雖有不錯提升,與國內及國際第一梯隊仍有競爭空間。 「標配」100 萬上下文,價格「王者」回歸。
相對於各項基準測試中的性能優勢,V4 發佈最大特色在於長文能力突破及 API 調用價格進一步下探。得益於 DeepSeek-V4 開創的全新注意力機制,透過 token 維度壓縮並結合 DSA(DeepSeek Sparse Attention),實現全球領先長上下文能力,且大幅降低計算與顯存需求,將 1M(一百萬)上下文變為所有官方服務標配。一年前,百萬上下文仍是 Gemini 獨家王牌,即便近期發佈多款國內開源模型,上下文長度多位於 128K—200K 區間,而 DeepSeek 直接將百萬
上下文從「高端閉源功能」變為開源標配。 在 API 價格上,相比 GLM-5.1 輸入單價 1.3 元人民幣 – 2 元人民幣 / 百萬 Tokens(緩存命中)及 Kimi-K2.6 1.1 元人民幣 / 百萬 Tokens(緩存命中),DeepSeek-V4-Pro 和 Flash 輸入單價分別為 1 元人民幣 / 百萬 Tokens 和 0.2 元人民幣 / 百萬 Tokens,雖價格降幅不大但均為最低,且上下文長度擴展數倍。
| 模型系列 | 輸入單價 (元人民幣 / 百萬 Tokens, 緩存命中) |
|---|---|
| DeepSeek-V4 系列 | Pro: 1 / Flash: 0.2 |
| Kimi-K2.6 | 1.1 |
| GLM-5.1 | 1.3 – 2 |
業界人士認為,DeepSeek-V4 性能突破相對 DeepSeek-R1 發佈時衝擊小了些,各項性能依舊處第一梯隊,但領先優勢未完全拉開。此次 V4 更在長文能力提升及價格進一步下探。該人士感嘆:「之前 DeepSeek-V3 及 R1 發佈後,透過底層技術創新帶來性能優勢,直接推動整個國內大模型行業集體降價,雖 V4 每百萬 Tokens 價格未下太多,但仍有競爭力,那個大模型價格王者又回來了!
」 值得留意的是,在 DeepSeek-V4 官方 API 價格資訊最下方,特別註明:「受限高端算力,目前 Pro 服務吞吐量有限,預計下半年華為昇騰 950 算點量產上市後,Pro 價格會大幅下調。」這意味 V4 系列已針對華為昇騰 950 完成適配,只要昇騰 950 上市,用戶即可基於國產算力享用比肩國際頂級閉源模型的 DeepSeek-V4。 官方開源技術文檔中,DeepSeek 亦提到此點,直言 V4 已於 NVIDIA GPU 和華為 Ascend NPU 平台驗證細粒度 EP(專用並
行)方案,相對於強融合基線,在通用推理任務上實現 1.50-1.73 倍加速效果,而在對延遲敏感場景(如 RL 推演及高速代理服務)中可達 1.96 倍加速。V4 發佈後,華為昇騰同步宣布「算點全系列產品支持 DeepSeek V4 系列模型」。據悉,昇騰 950 透過融合 kernel 和多卡並行技術降低 Attention 計算與存取開銷,大幅提升推理性能,結合多種量化算法,實現高吞吐、低延遲的 DeepSeek V4 模型推理部署。
本月上旬,OpenAI 創始人黃仁勳在接受 Dwarkesh Patel 專訪時曾言:「如果 DeepSeek 先在華為平台發佈,那對我們國家(美國)來說將是挑戰性。」在黃仁勳眼中,DeepSeek 作為開源模型,同樣可用於 OpenAI 產品,但若 DeepSeek 專門針對華為算力優化,在高端算力受限等局勢下,OpenAI 將處不利。現況顯示,DeepSeek 亦針對 OpenAI 算力進行 EP 方案驗證,但黃仁勳擔心的仍發生了。
業界人士看來,「V4 是算力博弈產物,未來一年,國產大模型將在國產卡上逐漸成勢。」 比較遺憾的是,DeepSeek V4 雖發佈,但該版本仍是純文字模型,無太多文生圖、文生視頻等多模態能力。這也讓普通用戶快速體驗評測一模型,平添不小難度。在大語言模型能力不斷提升、幻覺率逐步降低當下,常規、單一的知識問答已難客觀反差一模型綜合能力。對多數用戶而言,想直觀感受 V4 模型能力,得下載自行用上雲端。
V4 系列模型發佈同時,近期 DeepSeek 傳出融資 500 億元人民幣消息,有接近 DeepSeek 知情人士透露,融前估值 3000 億元人民幣,約 US$384 億,約 HK$2995 億,目前百度、阿里雲集團均在洽談投資 DeepSeek。惟對融資相關事宜,DeepSeek 方至今未正式回應媒體查詢。或許,對 DeepSeek 創始人梁文峰而言,在全球大模型「智力」增長放緩、行業人才競爭加劇、行業多模態化、Agentic 化趨勢不斷凸顯環境下,借 V4 發佈適時融資源實力,亦不失為明
智之舉。




