Google Gemini 3 正式發佈,初步體驗顯示其性能完全超越了 GPT-5 和 Claude sonnet 4.5,無論在編程還是寫作方面都達到了 T0 級別。這次更新可謂是自 OpenAI 發佈 ChatGPT 以來最令人興奮的事件,使用者已可在 Gemini App 和 Google AI Studio 中體驗。
Gemini 3 的核心特性
Google 將 Gemini 3 定義為“通往 AGI 之路的又一大步”。該系統在多模態理解上全球領先,並且是 Google 迄今為止最強大的智能體和“Vibe Coding”模型。
此次發佈包括兩個核心版本:Gemini 3 Pro(即日預覽上線)和增強推理模式的 Gemini 3 Deep Think。
同時,Google 宣布 Gemini 3 將全面接入 Google 生態系統,涵蓋從搜索到 AI Studio,再到全新的 Agent 開發平台 Google Antigravity。
在性能方面,Gemini 3 Pro 在每一項主流 AI 基準測試中都大幅超越了 Gemini 2.5 Pro,具體數據如下:
| 測試項目 | 得分 |
|---|---|
| LMArena Leaderboard | 1501 Elo |
| Humanity’s Last Exam | 37.5% |
| GPQA Diamond | 91.9% |
| MathArena Apex | 23.4% |
MMMU-Pro | 81% |
| Video-MMMU | 87.6% |
| SimpleQA Verified | 72.1% |
官方強調,Gemini 3 Pro 不再僅僅是簡單的問答系統,而是能夠理解語境和意圖,能夠讀懂文字、圖像,甚至能通過生成代碼將晦澀的科學概念轉化為高保真的可視化效果。
此外,Gemini 3 Deep Think 模式是為了解決最複雜的難題而設計的,測試數據顯示其性能進一步超越了 Pro 版本,具體數據如下:
| 測試項目 | 得分 |
|---|---|
| Humanity’s Last Exam | 41.0% |
| GPQA Diamond | 93.8% |
| ARC-AGI-2 | 45.1% |
隨著 Gemini 3 的發佈,Google 還推出了全新的 Agent 開發平台 Google Antigravity,將 Agent 提升至核心地位,具備自主權和強大的工具使用能力。這一平台不僅集成了 Gemini 3 Pro,還結合了最新的 Gemini 2.
5 Computer Use 模型和頂級圖像編輯模型 Nano Banana。
在編碼能力基準測試中,Gemini 3 的表現同樣出色:
| 測試項目 | 得分 |
|---|---|
| WebDev Arena | 1487 Elo |
| SWE-bench Verified | 76.2% |
| Terminal-Bench 2.0 | 54.2% |
Gemini 3 不僅面向開發者,還旨在幫助普通用戶學習、構建和規劃各類工作。學習方面,它能綜合處理文本、圖像、視頻、音頻和代碼,並支持生成式 UI 體驗,能即時生成交互式工具和沉浸式視覺布局。
Google 宣布,這是首次在發佈首日將新一代 Gemini 模型引入搜索。普通用戶可透過 Gemini App 及搜索中的 AI 模式使用,開發者則可通過 Google AI Studio、Google Antigravity、Gemini CLI 及 Vertex AI 訪問,企業用戶可通過 Vertex AI 和 Gemini Enterprise 訪問。
Deep Think 模式將在未來幾周向 Ultra 訂閱用戶開放。




