DeepSeek 更新提升上下文能力至 1M 但未發佈 V4 版本

DeepSeek 最近悄然更新了其最新版本,雖然原本預期在春節期間發佈的大模型 DeepSeek V4 似乎並不會如期推出,但新版本的亮點依然不少。根據 DeepSeek 的介紹,這次更新主要提升了上下文處理能力,達到了 1M,而之前的 DeepSeek V3 系列僅為 128K。

有了 1M 的上下文能力,DeepSeek 現在能夠一次性處理如《三體》三部曲這樣的超長文本,這一點已獲得多位網友的實測證實。雖然 DeepSeek 沒有透露更多具體信息,但其他能力則與之前版本相似。

值得一提的

是,DeepSeek 在回答問題後特別強調,這款模型是最新的 DeepSeek 模型,並沒有特定的子名稱,不是 V3 也不是 R1,似乎在刻意強調其獨特性,卻又不讓人Lenovo到這是 V4 的預覽版。不過,從網友的反饋來看,這次的小更新實際上帶來了不小的能力提升。知名大模型測試博主 @karminski-牙醫 已經針對編程方面進行了快速測試,特別是對一個大象牙膏的測試項目。

測試結果顯示,整體的美學、建模、物理模擬及代碼性能都有所提升,甚至還帶來了一些小驚喜,這一版本可謂是目前最優的大模型(主要是指 DS 的版本)。

目前尚不確定 DeepSeek 的這款新模型是否為完全體,因為有網友在測試時發現,針對最近熱門的「50 米距離上去洗車是走路還是開車去」的問題,DeepSeek 新模型給出的回答不一,有人認為正確,也有人表示不行。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。