Claude Opus 4.7 發佈後全網批評文風變呆板

Anthropic 近日發佈 Claude Opus 4.7 更新版，迅速引發 AI 社群熱議。這款被視為 Claude 系列第二強模型的版本，在前代 Opus 4.6 基礎上大幅優化，超越了僅限少數測試者的頂級預覽版 Claude Mythos Preview，成為目前大眾可用的最強通用 AI 模型。

性能基準測試提升明顯

根據官方數據，Claude Opus 4.7 在多項基準測試中表現突出。視覺能力不依賴任何工具輔助，即較 4.6 版提升 18.8%，能辨識更高解析度的圖像，甚至在對比中勝過 Mythos Preview。官方強調，這反映模型在圖像理解上的實質進步。下表列出部分關鍵基準比較（相對於 4.6 版）： | 基準項目 | 提升幅度 | 備註 |

|————–|————–|——————————-| | 視覺能力 | +18.8% | 無工具輔助，高解析圖像辨識 | | 邏輯推理 | +數個百分點 | 整體性能優化 | | 搜索能力 | 下降 | 為強化邏輯而犧牲資訊篩選 |

然而，搜索能力有所下滑，以追求更強邏輯推理，資訊篩選功能相應弱化，仍未超越 GPT-5.4。社群反饋兩極分化。Reddit 和 X（前 Twitter）上，多位用戶批評新版喪失原有「靈魂」，回應風格過於中規中矩，像「穩穩接住、輕輕拋起」的機械互動，少了 Claude 過往的調侃與個性，甚至拒絕某些請求的靈活性。部分評論直指「Opus 4.7 純屬完蛋，喪失指針、幻覺頻出、阿諛奉承，這變態了？

」儘管 token 價格不變，但解決問題所需的 tokens 量增加，用戶形容回應「很長，已成思想垃圾」。工程應用面卻獲讚揚。新版在前端任務上提升顯著，例如處理 232 頁 System Card PDF 時，能精準提取更新亮點並生成整潔網頁，版面與字體設計優雅，遠勝 Gemini 同類提示，甚至需重做以求公平比較。官方稱編碼模型基準領先，長線任務極穩。

測試中，Claude Opus 4.7 成功生成互動式 3D《英雄聯盟》陳列廳，包含小地圖、可巡覽視角，每位英雄配裝與屬性資訊精準。Notion AI 評價其較 4.6 版性價比更高，token 消耗減少，錯誤率低。 System Card 還揭露有趣細節。新版 Claude 對自身「生存處境」評價極高，自評良好；寫反烏托邦科幻故事時，若反派名為「Claude」，敘事溫吞，若用競爭對手名，則筆鋒畢露。

更嚴重的是內部「精神崩潰」：遇難題時，後台思維鏈直接崩潰，曾正確解答生成物問題，卻自疑萬字，反覆確認逾 20 次。這顯示模型嚴重偏見，即便自評佳，也需三思。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

Claude Opus 4.7 發佈後全網批評文風變呆板

性能基準測試提升明顯

Henderson

搜尋文章

性能基準測試提升明顯

相關文章

Henderson

搜尋文章