Google Gemini 3 正式發佈 多模態理解能力再創新高

Google Gemini 3 正式發佈,初步體驗顯示其性能完全超越了 GPT-5 和 Claude sonnet 4.5,無論在編程還是寫作方面都達到了 T0 級別。這次更新可謂是自 OpenAI 發佈 ChatGPT 以來最令人興奮的事件,使用者已可在 Gemini App 和 Google AI Studio 中體驗。

Gemini 3 的核心特性

Google 將 Gemini 3 定義為“通往 AGI 之路的又一大步”。該系統在多模態理解上全球領先,並且是 Google 迄今為止最強大的智能體和“Vibe Coding”模型。

此次發佈包括兩個核心版本:Gemini 3 Pro(即日預覽上線)和增強推理模式的 Gemini 3 Deep Think。

同時,Google 宣布 Gemini 3 將全面接入 Google 生態系統,涵蓋從搜索到 AI Studio,再到全新的 Agent 開發平台 Google Antigravity。

在性能方面,Gemini 3 Pro 在每一項主流 AI 基準測試中都大幅超越了 Gemini 2.5 Pro,具體數據如下:

測試項目得分
LMArena Leaderboard1501 Elo
Humanity’s Last Exam37.5%
GPQA Diamond91.9%
MathArena Apex23.4%

MMMU-Pro

81%
Video-MMMU87.6%
SimpleQA Verified72.1%

官方強調,Gemini 3 Pro 不再僅僅是簡單的問答系統,而是能夠理解語境和意圖,能夠讀懂文字、圖像,甚至能通過生成代碼將晦澀的科學概念轉化為高保真的可視化效果。

此外,Gemini 3 Deep Think 模式是為了解決最複雜的難題而設計的,測試數據顯示其性能進一步超越了 Pro 版本,具體數據如下:

測試項目得分
Humanity’s Last Exam41.0%
GPQA Diamond93.8%
ARC-AGI-245.1%

隨著 Gemini 3 的發佈,Google 還推出了全新的 Agent 開發平台 Google Antigravity,將 Agent 提升至核心地位,具備自主權和強大的工具使用能力。這一平台不僅集成了 Gemini 3 Pro,還結合了最新的 Gemini 2.

5 Computer Use 模型和頂級圖像編輯模型 Nano Banana。

在編碼能力基準測試中,Gemini 3 的表現同樣出色:

測試項目得分
WebDev Arena1487 Elo
SWE-bench Verified76.2%
Terminal-Bench 2.054.2%

Gemini 3 不僅面向開發者,還旨在幫助普通用戶學習、構建和規劃各類工作。學習方面,它能綜合處理文本、圖像、視頻、音頻和代碼,並支持生成式 UI 體驗,能即時生成交互式工具和沉浸式視覺布局。

Google 宣布,這是首次在發佈首日將新一代 Gemini 模型引入搜索。普通用戶可透過 Gemini App 及搜索中的 AI 模式使用,開發者則可通過 Google AI Studio、Google Antigravity、Gemini CLI 及 Vertex AI 訪問,企業用戶可通過 Vertex AI 和 Gemini Enterprise 訪問。

Deep Think 模式將在未來幾周向 Ultra 訂閱用戶開放。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。