Google Gemini 3 正式發佈多模態理解能力再創新高

Google Gemini 3 正式發佈，初步體驗顯示其性能完全超越了 GPT-5 和 Claude sonnet 4.5，無論在編程還是寫作方面都達到了 T0 級別。這次更新可謂是自 OpenAI 發佈 ChatGPT 以來最令人興奮的事件，使用者已可在 Gemini App 和 Google AI Studio 中體驗。

Gemini 3 的核心特性

Google 將 Gemini 3 定義為“通往 AGI 之路的又一大步”。該系統在多模態理解上全球領先，並且是 Google 迄今為止最強大的智能體和“Vibe Coding”模型。

此次發佈包括兩個核心版本：Gemini 3 Pro（即日預覽上線）和增強推理模式的 Gemini 3 Deep Think。

同時，Google 宣布 Gemini 3 將全面接入 Google 生態系統，涵蓋從搜索到 AI Studio，再到全新的 Agent 開發平台 Google Antigravity。

在性能方面，Gemini 3 Pro 在每一項主流 AI 基準測試中都大幅超越了 Gemini 2.5 Pro，具體數據如下：

測試項目	得分
LMArena Leaderboard	1501 Elo
Humanity’s Last Exam	37.5%
GPQA Diamond	91.9%
MathArena Apex	23.4%
MMMU-Pro	81%
Video-MMMU	87.6%
SimpleQA Verified	72.1%

官方強調，Gemini 3 Pro 不再僅僅是簡單的問答系統，而是能夠理解語境和意圖，能夠讀懂文字、圖像，甚至能通過生成代碼將晦澀的科學概念轉化為高保真的可視化效果。

此外，Gemini 3 Deep Think 模式是為了解決最複雜的難題而設計的，測試數據顯示其性能進一步超越了 Pro 版本，具體數據如下：

測試項目	得分
Humanity’s Last Exam	41.0%
GPQA Diamond	93.8%
ARC-AGI-2	45.1%

隨著 Gemini 3 的發佈，Google 還推出了全新的 Agent 開發平台 Google Antigravity，將 Agent 提升至核心地位，具備自主權和強大的工具使用能力。這一平台不僅集成了 Gemini 3 Pro，還結合了最新的 Gemini 2.

5 Computer Use 模型和頂級圖像編輯模型 Nano Banana。

在編碼能力基準測試中，Gemini 3 的表現同樣出色：

測試項目	得分
WebDev Arena	1487 Elo
SWE-bench Verified	76.2%
Terminal-Bench 2.0	54.2%

Gemini 3 不僅面向開發者，還旨在幫助普通用戶學習、構建和規劃各類工作。學習方面，它能綜合處理文本、圖像、視頻、音頻和代碼，並支持生成式 UI 體驗，能即時生成交互式工具和沉浸式視覺布局。

Google 宣布，這是首次在發佈首日將新一代 Gemini 模型引入搜索。普通用戶可透過 Gemini App 及搜索中的 AI 模式使用，開發者則可通過 Google AI Studio、Google Antigravity、Gemini CLI 及 Vertex AI 訪問，企業用戶可通過 Vertex AI 和 Gemini Enterprise 訪問。

Deep Think 模式將在未來幾周向 Ultra 訂閱用戶開放。

Google Gemini 3 正式發佈多模態理解能力再創新高

Gemini 3 的核心特性

Henderson

搜尋文章