DeepSeek 正式推出 V3.2 及 V3.2-Speciale 模型 兼具推理能力與計算效率

DeepSeek 今日宣布正式發佈兩個模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。這是繼兩個月前發佈的實驗性版本 DeepSeek-V3.2-Exp 之後的重大更新,目前官方網頁端、App 和 API 已更新至正式版 DeepSeek-V3.2,供用戶使用。至於 Speciale 版本,則以臨時 API 服務形式開放,主要用於社區評測與研究。 DeepSeek-V3.2 的設計旨在平衡推理能力與輸出長度,適合日常使用場景,如問答以及通用代理任務。在公開的推理類基準測試中,DeepSeek-V3.

2 達到了 GPT-5 的水平,僅次於 Gemini-3.0-Pro;相比 Kimi-K2-Thinking,V3.2 的輸出長度顯著降低,減少了計算開銷和用戶等待時間。

DeepSeek-V3.2-Speciale 版本

DeepSeek-V3.2-Speciale 的目標是將開源模型的推理能力推向極致,探索模型能力的邊界。該版本是 DeepSeek-V3.2 的長思考增強版,同時結合了 DeepSeek-Math-V2 的定理證明能力。該模型在指令跟隨、數學證明與邏輯驗證能力方面表現出色,在主流推理基準測試中的性能與 Gemini-3.

0-Pro 相媲美。 更引人注目的是,V3.2-Speciale 模型在 IMO 2025(國際數學奧林匹克)、CMO 2025(中國數學奧林匹克)、ICPC World Finals 2025(國際大學生程式設計競賽全球總決賽)及 IOI 2025(國際信息學奧林匹克)中斬獲金牌。其中,ICPC 和 IOI 的成績分別達到了人類選手第二名和第十名的水平。 在處理高度複雜的任務上,Speciale 模型的表現遠超標準版本,但其消耗的 Tokens 顯著增加,成本也更高。目前,DeepSeek-V3.

2-Speciale 僅供研究用途,不支持工具調用,且尚未針對日常對話與寫作任務進行專項優化。

Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。