Google AI Ultra 現已發佈 Gemini 2.5 Deep Think 版本

在 2025 年 5 月的 I/O 大會上預覽後,Google 現在向 AI Ultra 訂閱用戶推出了 Gemini 2.5 深度思考模式。

Google 表示,「深度思考通過利用平行思考技術推進思考能力的邊界。」這種方法使 Gemini 能夠同時生成多個想法,並在時間推移中修訂或結合不同的想法,最終得出最佳答案。

Gemini 被賦予更多推理或「思考時間」,以便「探索不同的假設,並找到複雜問題的創新解決方案」。Google 開發了新穎的強化學習技術,鼓勵模型利用這些擴展的推理路徑,從而使深度思考隨著時間的推移成為更好、更直觀的問題解決者。

深度思考可以產生「更長的回應」,並利用代碼執行、Google 搜索及其他工具。

今天的發布在「首次宣布」時提供了「顯著的改進」。Google 感謝早期受信測試者的反饋和「研究突破」,這些都為編碼、科學、知識和推理方面帶來了「關鍵的基準改進」。Gemini 2.5 深度思考現在在 LiveCodeBench(競賽級編碼)上的得分為 87.6%,而 5 月時為 80.4%。

在實用性方面,深度思考在「需要逐步構建複雜事物的任務」的迭代開發和設計方面表現出色。觀察到深度思考能夠改善網頁開發任務的美學和功能性。

它在「棘手的編碼問題」中表現出色,尤其是在問題表述以及對權衡和時間複雜性仔細考慮的情況下。Google 認為深度思考是解決高度複雜的科學和數學問題的強大工具:「它可以幫助制定和探索數學猜想,或推理複雜的科學文獻,有潛力加速發現的過程。」

例如,此次深度思考的發布可以在 2025 年國際數學奧林匹克(IMO)基準中獲得銅獎水平的表現,並且在日常使用中實際可行。相比之下,Google 現在向一些學者發布的深度思考模型的「變體」則是在金獎水平上需要數小時。

對於支付 Google AI Ultra 每月 $249.99 / 約 HK$ 1,949 的用戶,深度思考可以通過使用 Gemini 2.5 Pro 的提示欄中新增的按鈕啟用。訂閱者每天將在移動端和網頁上獲得「幾個提示」。

在未來幾周,Google 將通過 Gemini API 向受信測試者提供帶工具和不帶工具版本,以探索開發者和企業的使用案例。


十斗https://www.techritual.com/author/tenten/
十斗在知名大學取得了計算機科學與工程學位,並在學術研究方面表現出色。她的研究領域包括人工智能、機器學習和數據科學。一斗為十升,一升為十合,一合為十分之一升。謝靈運言天下才學一石,曹植占八斗,以此讚譽。後用以比喻才學極高。