Google 推出 Gemini 3 Deep Think 模式 針對 AI Ultra 訂閱用戶提升推理能力

Google 正式發佈全新的 Gemini 3 Deep Think 模式,這一模式在 Gemini 3 Pro 的基礎上投入了更多算力並引入新技術,旨在在複雜數學、科學與邏輯推理任務上提供更高水平的表現。Deep Think 現已面向所有 Google AI Ultra 訂閱用戶開放,使用者可在 Gemini 應用中選擇 Gemini 3 Pro 模型並切換至「Deep Think」模式直接使用。

根據介紹,Gemini 3 Deep Think 在多項業內高難度基準測試中取得了業界領先的成績。

在被視為當前最難的 AI 推理測評之一的 Humanity’s Last Exam 中獲得了 41% 的得分,而在 ARC-AGI-2 測試中憑藉代碼執行拿下 45.1% 的成績,GPQA Diamond 科學知識測試則獲得了 93.8% 的高分,均被標註為最先進水平。Google 表示,這一模式依托「高級並行推理」能力,可以同時探索多種假設路徑,大幅提升在複雜問題求解中的準確率和穩健性。

在實際競賽場景中,Deep Think 相關模型已展現出接近人類頂尖選手的實力。Google 提到,這些 Deep Think 變體近期在國際數學奧林匹克(IMO)和國際大學生程序設計競賽(ICPC)世界總決賽中達到了金牌標準。

在 IMO 測試設置中,模型需在兩場各 4.5 小時的考試中,在完全離線、不可調用工具或互聯網的條件下獨立解題並撰寫自然語言證明,對推理深度與表達能力要求極高。

對於終端用戶而言,Gemini 3 Deep Think 的定位是作為 Ultra 訂閱層中的高推理模式,主要面向需要嚴謹演繹、多步推理和高可靠性的複雜任務場景。Google 強調,這一模式是在現有 Gemini 3 Pro 能力之上通過額外算力與新技術堆疊而成,更適合處理高難度數學、科學研究問題及複雜邏輯分析需求。用戶只需在 Gemini 應用內將模型選項切換到 Gemini 3 Pro 並啟用 Deep Think,即可體驗這一增強版推理能力。

OpenAI 早在今年 7 月就宣稱其一款實驗性推理大模型已達到金牌級別的表現,但該模型至今尚未公開發佈。相比之下,Google 此次將達到 IMO 金牌標準的 Deep Think 模型直接開放給 Ultra 訂閱用戶使用,被視為對競品的一次先手發佈,外界普遍預計 OpenAI 可能在不久的將來跟進,將其高推理模型推向公眾。

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。