DeepSeek V4 測試接近 Opus 4.5 水平 複雜任務落後 GPT

下週左右,DeepSeek V4 即將登場,各種跡象顯示時間已非常接近,官方近期動作頻頻。目前發現 API 也開始升級模型,性能表現不俗。自 2 月 8 日上線測試版以來,DeepSeek V4 實際上一直處於低調變化狀態,只是官方每次並未詳細介紹升級內容。此前 DeepSeek V4 頁面升級時,新增了快速、專用及視覺等三種模式可選,不過之前的升級主要針對網頁版,如今 API 端的模型亦已切換。

只是尚未確定這款模型的具體名稱,分析來看,極有可能是參數量較小的 DeepSeek V4 Lite,性能最為突出。

社區測試揭露雙模型規格

當然,驚喜還不止於此。Linux.do 社區有大佬指出測試訊息,指 DeepSeek 將有 2 個模型,可調節思考位元,支持 FP8,並指令遵循更強。更重要的是,這裡提到其表現接近 Opus 4.5,惟複雜任務仍不及 GPT。儘管 Anthropic 已推出 Opus 4.6 及 4.7,但這兩個大模型近期爭議不斷,降智、用量大增等問題直接引發社區反彈。若 DeepSeek V4 中較大的模型能達到 Opus 4.

5 水準,絕對是開源大模型中的翹楚,這種能力已足夠絕大部分開發者使用,何況還是國產開源,限制比 A 家少很多。 但大家也要有心理準備,DeepSeek V4 的性能上去了,成本自然無法跟之前那樣低。參數量大的那款模型價格亦不會便宜。雖然這裡未提具體價格,但比 DeepSeek V3.X 肯定漲不少,應也不會達到 Opus 水準,整體性價比仍會有競爭力。 | 規格項目 | DeepSeek V4 預期 |

|———-|——————| | 模型數量 | 2 個(Lite 及較大版本) | | 思考位元調整 | 支持 | | 量化格式 | FP8 | | 指令遵循 | 更強 | | 表現對比 | 接近 Opus 4.5(複雜任務不及 GPT) |

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。