Moonshot AI 前日發佈並開源 Kimi K2.6 模型,在代碼、程式任務執行及 Agent 集體能力等方面全面升級。目前,Kimi K2.6 已上線 kimi 官網、最新的應用程式、API 及 Kimi Code 程式助手。在多項權威基準測試中,Kimi K2.6 表現亮眼。不論是高難度的「Humanity’s Last Exam」、側重真實軟件工程能力的 SWE-Bench Pro,以及評估 Agent 搜尋能力的 DeepSearchQA,成績均達到行業領先水平,持平或優於 GPT
-5.4、Claude Opus 4.6 及 Gemini 3.1 Pro 等閉源模型。
代碼及推理能力大幅提升
作為 Kimi 至今最強代碼模型,Kimi K2.6 的程式編碼能力大幅提升。在測試中,它能不間斷編碼 13 小時,編寫或修改超過 4000 行代碼,完成複雜系統的開發及優化。同時,透過將代碼與視覺能力深度融合,Kimi K2.6 可交付極具設計創意的專業級 Web 應用。在專屬代碼評測 Kimi Code Bench 中,K2.6 成績較上一代 K2.5 提升約 20%。
值得一提的是,其通用化能力同樣突出。實測顯示,Kimi K2.6 可在 Mac 本地部署模型,並透過 Zig 語言優化推理流程,在 4000 多次工具調用、12 小時連續運行中,將吞吐量從約 15 tokens/s 提升至約 193 tokens/s,最終實現比 LM Studio 快約 20% 的推理效率。 在 Agent 能力方面,Kimi K2.6 支持多 Agent 協同,可調度不同專長的 Agent 組合完成複雜任務,將搜尋、深度研究、文檔分析及長文生成等能力整合,整體任務品質顯著提
升。同時,其 Agent 集群架構亦迎來升級,最多支持 300 個子 Agent 平行運行、執行約 4000 個協作步驟,可一次性完成從文檔到網頁、再到 PPT 及表格的多產品端到端交付。




