DeepSeek API 輸入緩存價格降至首發十分之一中國

DeepSeek 重新定義大模型普惠邊界。DeepSeek 官方發佈 API 價格調整公告，全系 API 輸入緩存價格降至首發價格的十分之一，V4-Pro 更有限時 2.5 折，百萬 Tokens 輸入緩存低至 RMB¥0.03 (約 HK$0)，創全域大模型價格新低。根據 DeepSeek 官方 API 定價頁面顯示，此次降價涵蓋 V4 系列全模型，核心調整聚焦輸入緩存場景。

其中 DeepSeek-V4-Flash 輸入緩存價格從 0.2 元 / 百萬 Tokens 降至 0.02 元 / 百萬 Tokens。

API 價格規格對比

模型	輸入緩存 (原價 / 百萬 Tokens)	輸入緩存 (新價 / 百萬 Tokens)	降幅
DeepSeek-V4-Flash	RMB¥0.20 (約 HK$0)	RMB¥0.02 (約 HK$0)	90%
DeepSeek-V4-Pro	RMB¥1 (約 HK$1)	RMB¥0.10 (約 HK$0) (限時 RMB¥0.03 (約 HK$0)	90% (限時 97.5%)
DeepSeek-V4-Pro 緩存輸出	RMB¥12 (約 HK$13)	RMB¥3 (約 HK$3)	75%
DeepSeek-V4-Pro 輸出	RMB¥24 (約 HK$26)	RMB¥6 (約 HK$6)	75%

面對企業級用戶的 DeepSeek-V4-Pro 優勢更顯，限時優惠至 2026 年 5 月 5 日前，對比調整前後，高頻調用、長文本處理場景成本降逾 90%，RAG 知識庫、智能客服、文檔分析等緩存佔比高的應用，可直接實現商用成本斷崖式下降，有助打破 AI 規模化落地的成本枷鎖。DeepSeek 大幅降價背後，與 DeepSeek-V4 的技術升級及昇思生態深度協同有關。

DeepSeek-V4 預覽版正式發佈，同日開源 Pro 與 Flash 兩款模型，均支援 100 萬 token 上下文長度，自研稀疏注意力架構讓推理算力消耗大幅降低，Pro 版單 token 算力僅 V3.2 的 27%，KV 緩存降至 10%，從底層實現成本優化。 DeepSeek 官方公布參數顯示，DeepSeek-V4-Pro 激活參數 49B、預訓練數據 33T，定位高性能航母；DeepSeek-V4-Flash 激活參數 13B、預訓練數據 32T，主打高速與低成本。

與前代模型比較，DeepSeek-V4-Pro 的 Agent 能力顯著增強。在 Agentic Coding 評測中，V4-Pro 已達當前開源模型最佳水準，並在其他 Agent 相關評測中同樣表現優異。據悉，目前 DeepSeek-V4 已成為 DeepSeek 內部員工使用的 Agentic Coding 模型，評測反饋使用體驗優於 Sonnet 4.5，交互質量接近 Claude Opus 4.6 非思考模式，但仍與 Opus 4.6 思考模式存在一定差距。

V4 系列模型規格

模型	激活參數	預訓練數據	上下文長度	核心優勢
DeepSeek-V4-Pro	49B	33T	100 萬 token	高性能 Agent、數學 STEM 領先
DeepSeek-V4-Flash	13B	32T	100 萬 token	高速低成本推理

在世界知識測評中，DeepSeek-V4-Pro 大幅領先其他開源模型，積分超越頂尖閉源模型 Gemini-Pro-3.1。而在數學、STEM、競賽型代碼的測評中，DeepSeek-V4-Pro 全面超越當前所有已公開評測的開源模型，超越世界頂級閉源模型。相比 DeepSeek-V4-Pro，DeepSeek-V4-Flash 在世界知識存儲方面積分略勝一籌，但展現出接近的推理能力。

由於模型參數及激活更小，相對之下 V4-Flash 能提供更快、更經濟的 API 服務。DeepSeek-V4 還開創一種新型注意力機制，在 token 維度進行壓縮，結合 DSA（DeepSeek Sparse Attention），實現全球領先的長上下文能力，且相較傳統方法大幅降低了對計算與顯存的需求。昇思生態全系產品支援 DeepSeek V4 系列模型，這也意味著 DeepSeek 釋放了更多國產化信號。

DeepSeek-V4 在一份技術報告中提到，「在英偉達 GPU 與華為昇思 NPU 兩個平台上驗證了細粒度 EP（專用並行）方案，與強力非融合（non-fused）基線相比，該方案在通用推理任務中實現 1.50-1.73 倍加速；在對延遲敏感場景（如強化學習（RL）rollout 及高速 Agent 服務）中，最高可達 1.96 倍加速。」DeepSeek 強調，昇思生態全系產品即將批量上市，Pro 版價格有望大幅下調。

華為證券認為，市場將 V4 解讀為「降成本壓算力、存儲需求」，但更重要的邊界變化在於長上下文成本下降後，複雜 Agent、多文檔分析、長週期任務、在線學習等場景可用性提升，推理調用量與存儲訪問頻率有望擴大。

DeepSeek API 輸入緩存價格降至首發十分之一中國

API 價格規格對比

V4 系列模型規格

Henderson

搜尋文章

API 價格規格對比

V4 系列模型規格

相關文章

Henderson

搜尋文章