Anthropic 官方宣布推出 Claude Sonnet 5,這是一款最新的智能代理模型,具備更強的計劃能力,能夠使用瀏覽器和終端等工具,自主運行的水平已經達到幾個月前需要更大、更昂貴模型的程度。
Claude Sonnet 5 的性能提升
根據官方資料,Claude Sonnet 5 在智能代理性能方面有顯著提升,特別是在推理、工具使用、編碼和知識工作等重要方面。與其前身 Sonnet 4.6 相比,Sonnet 5 的整體不良行為率較低,使用於智能代理環境中更為安全。
「Sonnet 5 顯示出整體較低的不良行為率,並且在智能代理環境中更為安全。」
Anthropic
可用性及定價策略
從今天開始,Claude Sonnet 5 在所有計劃中均可使用,成為免費和專業計劃的默認模型,並對 Max、Team 和 Enterprise 用戶開放。其推出的介紹價格為每百萬個輸入標記 USD 2 和每百萬個輸出標記 USD 10,直至 2026 年 8 月 31 日,之後將調整為每百萬個輸入標記 USD 3 和每百萬個輸出標記 USD 15。
「Claude Sonnet 5 的推出標誌著智能代理模型的進一步發展,並提供更具成本效益的選擇。」
Anthropic
用戶反饋及安全性評估
來自早期接入合作夥伴的反饋顯示,Sonnet 5 在智能代理能力上明顯優於其前身。測試者表示,Sonnet 5 能夠完成複雜任務,並在未明確要求的情況下檢查其輸出。根據預部署安全評估,Sonnet 5 在拒絕惡意請求和抵抗提示注入攻擊方面表現更佳。
「Sonnet 5 在智能安全性方面優於 Sonnet 4.6,更能拒絕惡意請求。」
Anthropic
儘管 Sonnet 5 在某些例行的非有害網絡安全任務上表現良好,但在開發潛在危險的網絡技能方面,其表現仍不及 Opus 4.8 和 Mythos 5 模型。為了保障安全,Sonnet 5 預設啟用網絡安全防護措施,這些防護措施能實時檢測和阻止危險的網絡使用。
資料來源:Anthropic 官方公告

