DeepSeek 重新定義大模型普惠邊界。DeepSeek 官方發佈 API 價格調整公告,全系 API 輸入緩存價格降至首發價格的十分之一,V4-Pro 更有限時 2.5 折,百萬 Tokens 輸入緩存低至 0.025 元人民幣,約 HK$0.027,創全域大模型價格新低。根據 DeepSeek 官方 API 定價頁面顯示,此次降價涵蓋 V4 系列全模型,核心調整聚焦輸入緩存場景。
其中 DeepSeek-V4-Flash 輸入緩存價格從 0.2 元 / 百萬 Tokens 降至 0.02 元 / 百萬 Tokens。
API 價格規格對比
| 模型 | 輸入緩存 (原價 / 百萬 Tokens) | 輸入緩存 (新價 / 百萬 Tokens) | 降幅 |
|---|---|---|---|
| DeepSeek-V4-Flash | 0.2 元人民幣,約 HK$0.218 | 0.02 元人民幣,約 HK$0.022 | 90% |
| DeepSeek-V4-Pro | 1 元人民幣,約 HK$1.09 | 0.1 元人民幣,約 HK$0.109 (限時 0.025 元人民幣,約 HK$0.027) | 90% (限時 97.5%) |
| DeepSeek-V4-Pro 緩存輸出 | 12 元人民幣,約 HK$13.08 | 3 元人民幣,約 HK$3.27 | 75% |
| DeepSeek-V4-Pro 輸出 | 24 元人民幣,約 HK$26.16 | 6 元人民幣,約 HK$6.54 | 75% |
面對企業級用戶的 DeepSeek-V4-Pro 優勢更顯,限時優惠至 2026 年 5 月 5 日前,對比調整前後,高頻調用、長文本處理場景成本降逾 90%,RAG 知識庫、智能客服、文檔分析等緩存佔比高的應用,可直接實現商用成本斷崖式下降,有助打破 AI 規模化落地的成本枷鎖。DeepSeek 大幅降價背後,與 DeepSeek-V4 的技術升級及昇思生態深度協同有關。
DeepSeek-V4 預覽版正式發佈,同日開源 Pro 與 Flash 兩款模型,均支援 100 萬 token 上下文長度,自研稀疏注意力架構讓推理算力消耗大幅降低,Pro 版單 token 算力僅 V3.2 的 27%,KV 緩存降至 10%,從底層實現成本優化。 DeepSeek 官方公布參數顯示,DeepSeek-V4-Pro 激活參數 49B、預訓練數據 33T,定位高性能航母;DeepSeek-V4-Flash 激活參數 13B、預訓練數據 32T,主打高速與低成本。
與前代模型比較,DeepSeek-V4-Pro 的 Agent 能力顯著增強。在 Agentic Coding 評測中,V4-Pro 已達當前開源模型最佳水準,並在其他 Agent 相關評測中同樣表現優異。據悉,目前 DeepSeek-V4 已成為 DeepSeek 內部員工使用的 Agentic Coding 模型,評測反饋使用體驗優於 Sonnet 4.
5,交互質量接近 Claude Opus 4.6 非思考模式,但仍與 Opus 4.6 思考模式存在一定差距。
V4 系列模型規格
| 模型 | 激活參數 | 預訓練數據 | 上下文長度 | 核心優勢 |
|---|---|---|---|---|
| DeepSeek-V4-Pro | 49B | 33T | 100 萬 token | 高性能 Agent、數學 STEM 領先 |
| DeepSeek-V4-Flash | 13B | 32T | 100 萬 token | 高速低成本推理 |
在世界知識測評中,DeepSeek-V4-Pro 大幅領先其他開源模型,積分超越頂尖閉源模型 Gemini-Pro-3.1。而在數學、STEM、競賽型代碼的測評中,DeepSeek-V4-Pro 全面超越當前所有已公開評測的開源模型,超越世界頂級閉源模型。相比 DeepSeek-V4-Pro,DeepSeek-V4-Flash 在世界知識存儲方面積分略勝一籌,但展現出接近的推理能力。
由於模型參數及激活更小,相對之下 V4-Flash 能提供更快、更經濟的 API 服務。DeepSeek-V4 還開創一種新型注意力機制,在 token 維度進行壓縮,結合 DSA(DeepSeek Sparse Attention),實現全球領先的長上下文能力,且相較傳統方法大幅降低了對計算與顯存的需求。 昇思生態全系產品支援 DeepSeek V4 系列模型,這也意味著 DeepSeek 釋放了更多國產化信號。
DeepSeek-V4 在一份技術報告中提到,「在英偉達 GPU 與華為昇思 NPU 兩個平台上驗證了細粒度 EP(專用並行)方案,與強力非融合(non-fused)基線相比,該方案在通用推理任務中實現 1.50-1.73 倍加速;在對延遲敏感場景(如強化學習(RL)rollout 及高速 Agent 服務)中,最高可達 1.96 倍加速。」DeepSeek 強調,昇思生態全系產品即將批量上市,Pro 版價格有望大幅下調。
華為證券認為,市場將 V4 解讀為「降成本壓算力、存儲需求」,但更重要的邊界變化在於長上下文成本下降後,複雜 Agent、多文檔分析、長週期任務、在線學習等場景可用性提升,推理調用量與存儲訪問頻率有望擴大。




