Anthropic 發佈 Claude Opus 4.8 提升 AI 模型透明度與誠實性

Anthropic 發佈了 Claude Opus 4.8，這是其旗艦人工智能模型的新版本，公司表示此版本在執行複雜任務時較不容易隱藏錯誤或發表無根據的聲明。此次升級在 Claude Opus 4.7 的基礎上推出，正值人工智能公司競相提升自主系統在編碼、研究和企業工作流程中的可靠性。Anthropic 表示，該模型在編碼、推理和代理基準測試方面均有所改進，同時在不確定性方面變得更加透明。

Claude Opus 4.8 在長時間任務中顯著提高誠實性

Opus 4.8 的一個重大變化是其在長時間任務中的誠實性。人工智能模型經常自信地提供不正確的信息，或在缺乏足夠證據的情況下聲稱進展。Anthropic 表示，這個新模型在標示不確定性和識別自身輸出中的缺陷方面做得更好，而不是默默地傳遞錯誤。該公司表示，內部評估顯示，Opus 4.8 “在允許其編寫的代碼中缺陷不被指出的概率上，比其前身低約四倍”。

Anthropic 指出，早期測試者發現該模型在處理代理任務時更為可靠，這類任務中，人工智能系統需獨立規劃和執行多步操作。該公司還強調了在一致性和安全行為方面的改進。根據 Anthropic 的説法，其一致性團隊認為，Opus 4.8 “在支持用户自主和以用户最佳利益行事等親社會特徵的測量上達到新高”。評估還發現，相較於 Opus 4.7，其不一致行為的發生率降低，包括欺騙和與濫用的合作。

Anthropic 引入新功能以擴展 Claude 的能力

隨著模型的升級，Anthropic 引入了新功能，旨在擴展 Claude 處理大規模編碼和推理任務的能力。其中一項名為 Dynamic Workflows for Claude Code 的研究預覽功能，該系統允許 Claude 將大型任務分解為小任務，由數百個平行的人工智能子代理在單一會話中處理。Anthropic 表示，該功能可執行涉及數十萬行代碼的代碼庫級遷移，並在向用户報告結果之前檢查輸出是否符合現有測試套件。

該公司還在 claude.ai 和 Cowork 上增加了一個努力控制設置，用户現在可以決定模型在任務上花費多少計算努力。較低的努力設置優先考慮更快的響應和減少令牌使用，而較高的設置則允許模型花更多時間推理困難的提示。Anthropic 表示，Opus 4.8 默認設置為高努力模式，旨在平衡質量和用户體驗。此外，該公司還降低了其快速模式的定價，現在的速度是早期模型的 2.5 倍，而成本則低於之前的版本。

Anthropic 還表示，正在為 Project Glasswing 準備更先進的 “Mythos-class” 模型。這些系統目前正與少數組織進行網絡安全應用測試，待更廣泛發佈前仍在開發更強的網絡安全防護。Claude Opus 4.8 現已通過 claude.ai 和 Claude API 提供使用。

📬 免費訂閱 TechRitual 科技精選

按「免費訂閱」即同意收到 TechRitual 嘅科技資訊及優惠。可隨時取消訂閱。

Anthropic 發佈 Claude Opus 4.8 提升 AI 模型透明度與誠實性

Claude Opus 4.8 在長時間任務中顯著提高誠實性

Anthropic 引入新功能以擴展 Claude 的能力

📬 免費訂閱 TechRitual 科技精選

Henderson

搜尋文章