DeepSeek 最近悄然更新了其最新版本,雖然原本預期在春節期間發佈的大模型 DeepSeek V4 似乎並不會如期推出,但新版本的亮點依然不少。根據 DeepSeek 的介紹,這次更新主要提升了上下文處理能力,達到了 1M,而之前的 DeepSeek V3 系列僅為 128K。
有了 1M 的上下文能力,DeepSeek 現在能夠一次性處理如《三體》三部曲這樣的超長文本,這一點已獲得多位網友的實測證實。雖然 DeepSeek 沒有透露更多具體信息,但其他能力則與之前版本相似。
值得一提的
是,DeepSeek 在回答問題後特別強調,這款模型是最新的 DeepSeek 模型,並沒有特定的子名稱,不是 V3 也不是 R1,似乎在刻意強調其獨特性,卻又不讓人Lenovo到這是 V4 的預覽版。不過,從網友的反饋來看,這次的小更新實際上帶來了不小的能力提升。知名大模型測試博主 @karminski-牙醫 已經針對編程方面進行了快速測試,特別是對一個大象牙膏的測試項目。
測試結果顯示,整體的美學、建模、物理模擬及代碼性能都有所提升,甚至還帶來了一些小驚喜,這一版本可謂是目前最優的大模型(主要是指 DS 的版本)。
目前尚不確定 DeepSeek 的這款新模型是否為完全體,因為有網友在測試時發現,針對最近熱門的「50 米距離上去洗車是走路還是開車去」的問題,DeepSeek 新模型給出的回答不一,有人認為正確,也有人表示不行。




