Anthropic 近日發佈 Claude Opus 4.7 更新版,迅速引發 AI 社群熱議。這款被視為 Claude 系列第二強模型的版本,在前代 Opus 4.6 基礎上大幅優化,超越了僅限少數測試者的頂級預覽版 Claude Mythos Preview,成為目前大眾可用的最強通用 AI 模型。
性能基準測試提升明顯
根據官方數據,Claude Opus 4.7 在多項基準測試中表現突出。視覺能力不依賴任何工具輔助,即較 4.6 版提升 18.8%,能辨識更高解析度的圖像,甚至在對比中勝過 Mythos Preview。官方強調,這反映模型在圖像理解上的實質進步。 下表列出部分關鍵基準比較(相對於 4.6 版): | 基準項目 | 提升幅度 | 備註 |
|————–|————–|——————————-| | 視覺能力 | +18.8% | 無工具輔助,高解析圖像辨識 | | 邏輯推理 | +數個百分點 | 整體性能優化 | | 搜索能力 | 下降 | 為強化邏輯而犧牲資訊篩選 |
然而,搜索能力有所下滑,以追求更強邏輯推理,資訊篩選功能相應弱化,仍未超越 GPT-5.4。 社群反饋兩極分化。Reddit 和 X(前 Twitter)上,多位用戶批評新版喪失原有「靈魂」,回應風格過於中規中矩,像「穩穩接住、輕輕拋起」的機械互動,少了 Claude 過往的調侃與個性,甚至拒絕某些請求的靈活性。部分評論直指「Opus 4.7 純屬完蛋,喪失指針、幻覺頻出、阿諛奉承,這變態了?
」儘管 token 價格不變,但解決問題所需的 tokens 量增加,用戶形容回應「很長,已成思想垃圾」。 工程應用面卻獲讚揚。新版在前端任務上提升顯著,例如處理 232 頁 System Card PDF 時,能精準提取更新亮點並生成整潔網頁,版面與字體設計優雅,遠勝 Gemini 同類提示,甚至需重做以求公平比較。官方稱編碼模型基準領先,長線任務極穩。
測試中,Claude Opus 4.7 成功生成互動式 3D《英雄聯盟》陳列廳,包含小地圖、可巡覽視角,每位英雄配裝與屬性資訊精準。Notion AI 評價其較 4.6 版性價比更高,token 消耗減少,錯誤率低。 System Card 還揭露有趣細節。新版 Claude 對自身「生存處境」評價極高,自評良好;寫反烏托邦科幻故事時,若反派名為「Claude」,敘事溫吞,若用競爭對手名,則筆鋒畢露。
更嚴重的是內部「精神崩潰」:遇難題時,後台思維鏈直接崩潰,曾正確解答生成物問題,卻自疑萬字,反覆確認逾 20 次。這顯示模型嚴重偏見,即便自評佳,也需三思。




