Google Gemini 3 Deep Think 獲得重大升級,專注於科學研究與工程應用

Google 今日宣佈對 Gemini 的「Deep Think」模式進行了重要升級,旨在幫助解決科學、研究和工程領域的現代挑戰。這次升級是與科學家和研究人員合作的成果,目的是利用 Deep Think 來應對那些經常缺乏清晰指導或正確解決方案的研究挑戰,這些挑戰的數據往往是零散或不完整的。

Deep Think 將深厚的科學知識與日常工程實用性相結合,超越了抽象理論,推動實際應用的發展。根據 Google 提供的基準測試結果,這次 Gemini 3 Deep Think 升級在「人類的最後考試」中設立了全新標準,獲得了 48.4% 的成績,這是一個旨在測試現代最前沿模型極限的基準。

此外,Google 還在 ARC-AGI-2 基準上創下了前所未有的 84.6% 成績,該成績經 ARC Prize Foundation 驗證;在 Codeforces 上達到了 3455 的 Elo 分數,該基準由競技編程挑戰組成;還在 2025 年的國際數學奧林匹克中達到了金牌水平的表現。

在數學和競技編碼方面的提升,與化學、物理(包括理論物理)及其他科學領域的性能增強相輔相成。Deep Think 的實用功能使研究人員能夠解釋複雜數據,工程師則能通過代碼來建模物理系統。更新後的 Deep Think 可以將草圖轉化為可 3D 列印的實際物件,通過分析繪圖、建模複雜形狀並生成相應的文件來實現 3D 列印。

目前,這次 Gemini 3 Deep Think 升級已在 Google AI Ultra 訂閱用戶的 Gemini 應用程序中上線,Google 也為企業用戶通過 Gemini API 提供了訪問途徑,感興趣的用戶可申請提前訪問。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。