近日中國國產大模型升級頻繁,繼 GLM-5.1 和 MiniMax 2.7 開源之後,月之暗面的 Kimi K2.6-code-preview 亦登場。這是一款專為 AI 編程優化的萬億參數大模型。官網顯示已上線,但體驗此模型需 Kimi 會員帳戶,每日起價 RMB¥39 (約 HK$42),可在 Kimi Code 中使用。 K2.6-code-preview 低調發布,先前測試未大肆宣傳,這兩天才見相關討論。
Kimi 官方亦未大力宣傳,目前官網尚未見明顯升級標示。從網絡測試反饋和介紹來看,此模型基於 K2.5 萬億參數基礎改進,主要優化聚焦 AI 編程。K2.5 在 SWE-Bench Verified 榜單評分為 76.8%,LiveCodeBench 則達 85%。
性能規格對比
| 模型 | SWE-Bench Verified | LiveCodeBench | 自測編程分數 (Versun) |
|---|---|---|---|
| K2.5 | 76.8% | 85% | 83 分 |
| K2.6-code-preview | – | – | 89 分 |
K2.6-code-preview 提升方向涵蓋推理深度、代理規模質量及多步工具調用可靠性。有測試者指其思維鏈有 Opus 風格。實測水準方面,大V Versun 評測自身編程能力,K2.6-code-preview 得分 89 分,比 K2.5 的 83 分提升 6 分,惟與頂級選項仍有差距。相較其他廠商宣傳中動輒追平或超越 Opus 4.6,K2.6-code-preview 被網友評為 Sonnet 4.6 水準,已屬強勁。 已上線用戶反饋正面,指指令遵循能力行,表現不俗。搭配 Kimi Coding Plan 套餐,至少為 AI 編程提供強大且性價比高的選擇。
📬 免費訂閱 TechRitual 科技精選
按「免費訂閱」即同意收到 TechRitual 嘅科技資訊及優惠。可隨時取消訂閱。

