Google 突然發佈 Gemini 3.1 Pro,AI 推理能力提升 100%

幾個月前,Google 發佈了 Gemini 3.0,現在正預覽其最新版本 Gemini 3.1 Pro。這款新模型專為解決複雜、多步驟的問題而設計,這些問題多數聊天機器人仍然難以處理。此升級隨著 Google 推出其 Deep Think 功能而來,該功能擴展了平台在研究、工程和科學領域的應用。

Gemini 3.1 Pro 是這些進步的核心,Google 現在同時將其應用於消費者應用程式、開發者工具和企業平台。主要的升級在於推理能力的提升。Gemini 3.1 Pro 可以處理如整合大型數據集、用視覺方式解釋複雜概念,以及解決需要多個步驟的問題,而不僅僅是單一的提示和回覆。

根據基準測試,這一點並非僅是市場宣傳。Google 表示,該模型在 ARC-AGI-2 測試中獲得了 77.1% 的分數,這是一項針對抽象推理和新邏輯模式的測試,這一分數超過了前一版本 Gemini 3 Pro 的兩倍。

在幕後,該模型的運作方式同樣重要。Gemini 3.1 Pro 專注於自主行為,使其能夠使用工具、規劃多步驟的工作流程,並自行完成任務,而不必每次都需要用戶輸入。這一改變支援更優化的助理、更智能的編碼以及更具動態的應用程序。

對於開發者而言,Gemini 3.1 Pro 不僅更智能,還能在現實情況下表現更好。早期的預覽顯示其編碼結果更佳、自主任務處理更有效,以及改進的編輯後測試循環,減少了解決問題所需的工具調用次數。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。