經過超過七個月的期待,Google 正式發佈了其最先進的 Gemini 3 Pro 人工智能模型。根據 Google 的說法,Gemini 3 代表著“高度能力的多模態推理模型套件”。隨著 Gemini 3 的推出,Google 宣稱它在邁向人工通用智能(AGI)的路上邁出了又一大步。
在架構方面,Gemini 3 Pro 是一個稀疏的專家混合模型,基於 Transformer 架構構建。此外,Google 表示 Gemini 3 Pro 僅在 Google 的 TPU 上進行訓練,這一點相當令人印象深刻。Gemini 3 Pro 在性能基準測試中表現出色。在困難的人類最後考試中,Gemini 3 Pro 在未使用任何工具的情況下取得了 37.5% 的成績,甚至超越了 OpenAI 最新的 GPT-5.1 模型,其得分為 26.5%。在 LMArena 中,Gemini 3 Pro 以 1,501 分的 ELO 分數佔據首位。
在新的 ARC-AGI-2 基準測試中,Gemini 3 Pro 獲得了 31.1% 的分數,再次擊敗了僅獲得 17.6% 的 GPT-5.1。在 SWE-Bench Verified 中,Gemini 3 Pro 獲得了 76.2%,幾乎與 GPT-5.1 的 76.3% 持平。然而,在這一基準中,Anthropic 的 Claude Sonnet 4.5 仍然以 77.2% 的成績領先。Google 也在努力將 Gemini 3 Deep Think 帶給 Google AI Ultra 訂閱用戶,該模型在 Humanity’s Last Exam 中獲得了 41%,在 ARC-AGI-2 中則獲得了 45.1%。在代理編碼方面,Gemini 3 Pro 在 WebDev Arena 中以 1,487 的 ELO 分數領先,能夠進行長期、高層次的規劃,執行多步驟的現實任務。
此外,Google 還推出了一個名為 Antigravity 的開發平台,這基本上是一個以代理為主的開發環境。它集合了 Gemini 3 Pro、Gemini 2.5 計算模型和 Nano Banana 圖像生成模型。代理可以直接控制編輯器、終端和瀏覽器,以計劃任務和執行代碼。從今天開始,Gemini 3 Pro 正在 Gemini 應用程式中向所有人推出,Pro 和 Ultra 訂閱用戶可以在 Google Search 的 AI 模式中使用這一新模型。這一系列的發展無疑將進一步推動人工智能技術的進步,並拓展其應用範疇,尤其是在日常生活和商業運作中的應用。





























































