月之暗面發佈 Kimi K2.6 模型　編碼測試不間斷 13 小時對標 GPT-5.4

Moonshot AI 前日發佈並開源 Kimi K2.6 模型，在代碼、程式任務執行及 Agent 集體能力等方面全面升級。目前，Kimi K2.6 已上線 kimi 官網、最新的應用程式、API 及 Kimi Code 程式助手。在多項權威基準測試中，Kimi K2.6 表現亮眼。不論是高難度的「Humanity’s Last Exam」、側重真實軟件工程能力的 SWE-Bench Pro，以及評估 Agent 搜尋能力的 DeepSearchQA，成績均達到行業領先水平，持平或優於 GPT

-5.4、Claude Opus 4.6 及 Gemini 3.1 Pro 等閉源模型。

代碼及推理能力大幅提升

作為 Kimi 至今最強代碼模型，Kimi K2.6 的程式編碼能力大幅提升。在測試中，它能不間斷編碼 13 小時，編寫或修改超過 4000 行代碼，完成複雜系統的開發及優化。同時，透過將代碼與視覺能力深度融合，Kimi K2.6 可交付極具設計創意的專業級 Web 應用。在專屬代碼評測 Kimi Code Bench 中，K2.6 成績較上一代 K2.5 提升約 20%。

值得一提的是，其通用化能力同樣突出。實測顯示，Kimi K2.6 可在 Mac 本地部署模型，並透過 Zig 語言優化推理流程，在 4000 多次工具調用、12 小時連續運行中，將吞吐量從約 15 tokens/s 提升至約 193 tokens/s，最終實現比 LM Studio 快約 20% 的推理效率。在 Agent 能力方面，Kimi K2.6 支持多 Agent 協同，可調度不同專長的 Agent 組合完成複雜任務，將搜尋、深度研究、文檔分析及長文生成等能力整合，整體任務品質顯著提

升。同時，其 Agent 集群架構亦迎來升級，最多支持 300 個子 Agent 平行運行、執行約 4000 個協作步驟，可一次性完成從文檔到網頁、再到 PPT 及表格的多產品端到端交付。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

月之暗面發佈 Kimi K2.6 模型　編碼測試不間斷 13 小時對標 GPT-5.4

代碼及推理能力大幅提升

Henderson

搜尋文章

代碼及推理能力大幅提升

相關文章

Henderson

搜尋文章