Anthropic 發佈 Claude Sonnet 5,強化智能代理能力

Anthropic 官方宣布推出 Claude Sonnet 5,這是一款最新的智能代理模型,具備更強的計劃能力,能夠使用瀏覽器和終端等工具,自主運行的水平已經達到幾個月前需要更大、更昂貴模型的程度。

Claude Sonnet 5 的性能提升

根據官方資料,Claude Sonnet 5 在智能代理性能方面有顯著提升,特別是在推理、工具使用、編碼和知識工作等重要方面。與其前身 Sonnet 4.6 相比,Sonnet 5 的整體不良行為率較低,使用於智能代理環境中更為安全。

「Sonnet 5 顯示出整體較低的不良行為率,並且在智能代理環境中更為安全。」

Anthropic

可用性及定價策略

從今天開始,Claude Sonnet 5 在所有計劃中均可使用,成為免費和專業計劃的默認模型,並對 Max、Team 和 Enterprise 用戶開放。其推出的介紹價格為每百萬個輸入標記 USD 2 和每百萬個輸出標記 USD 10,直至 2026 年 8 月 31 日,之後將調整為每百萬個輸入標記 USD 3 和每百萬個輸出標記 USD 15。

「Claude Sonnet 5 的推出標誌著智能代理模型的進一步發展,並提供更具成本效益的選擇。」

Anthropic

用戶反饋及安全性評估

來自早期接入合作夥伴的反饋顯示,Sonnet 5 在智能代理能力上明顯優於其前身。測試者表示,Sonnet 5 能夠完成複雜任務,並在未明確要求的情況下檢查其輸出。根據預部署安全評估,Sonnet 5 在拒絕惡意請求和抵抗提示注入攻擊方面表現更佳。

「Sonnet 5 在智能安全性方面優於 Sonnet 4.6,更能拒絕惡意請求。」

Anthropic

儘管 Sonnet 5 在某些例行的非有害網絡安全任務上表現良好,但在開發潛在危險的網絡技能方面,其表現仍不及 Opus 4.8 和 Mythos 5 模型。為了保障安全,Sonnet 5 預設啟用網絡安全防護措施,這些防護措施能實時檢測和阻止危險的網絡使用。

資料來源:Anthropic 官方公告

十斗
十斗

十斗是 TechRitual Hong Kong 科技記者,擁有計算機科學與工程學位,專注報導 AI 人工智能、Google、機器學習及數據科學領域。持續追蹤全球 AI 產業動態,為讀者提供深入淺出的科技分析。

友情網站:日本語版 / TechNipponThe Base Principle(AI・工程)