Google 上個月推出了 Gemini 3 系列的首個 AI 模型,該模型立即在 LMArena 和 WebDev Arena 的基準測試中表現出色。這款模型名為 Gemini 3 Pro Preview,廣泛應用於 Gemini 應用程序、搜尋的 AI 模式以及 Google 的開發者工具。不過,該公司還預覽了一款更強大的 Gemini 3 Deep Think 模型,該模型在公眾發佈前進行了額外的安全評估。
目前,Gemini 3 Deep Think 已經在 Gemini 應用程序中正式可用。Google 本週在部落格中宣布,這款模型正逐步向 Google AI Ultra 訂戶推送。Gemini 3 Deep Think 是 Gemini 2.5 Deep Think 的後繼版本,後者曾是 Google 最佳的高級推理 AI 模型。Gemini 3 Deep Think 在知識和推理基準測試中表現優於 Gemini 3 Pro。
在「人類的最後考試」中,Gemini 3 Deep Think 在不使用工具的情況下得分為 41%;相比之下,標準的 Gemini 3 Pro 模型僅達到 37.5%。在 ARC-AGI-2 基準測試中,Gemini 3 Deep Think 在執行代碼的情況下得分為 45.1%,Google 將這一結果形容為「前所未有」。
在 Gemini 應用中,Gemini 3 Deep Think 被標示為「實驗性」。其橫幅稱這款模型是 Google「最先進的推理功能」。目前,Gemini 3 Deep Think 只對 Google AI Ultra 訂戶開放,這大大限制了能夠試用這款下一代思考模型的 Gemini 用戶數量。
Google AI Ultra 的月費為 $250 / 約 HK$ 1,950,主要針對高級用戶和商業應用。因此,若要使用 Gemini 3 Deep Think,用戶需在 Gemini 應用的工具菜單中選擇 Deep Think,這僅在選擇思考模型時可用。至今,Deep Think 仍然僅限於 AI Ultra 訂戶,AI Pro 用戶在未來改變之前應不會獲得訪問權限。




