Google Gemini 3 Pro 發佈具備全新功能及高效能表現

Google 正式發佈了 Gemini 3 Pro，這一消息來得相當突然，且相對低調。雖然在此之前，Google 推出了圖片編輯模型 Nano Banana，提升了一些存在感，但在基座模型方面，Google 靜默了過久。過去這大半年，業界更多討論的是 OpenAI 的新動作，或是 Claude 在代碼方面的表現，卻鮮有提及已經有 8 個月沒有版本號更新的 Gemini。

儘管 Google 的雲業務和財報表現不錯，但在 AI 開發者的核心圈子中，Google 的影響力似乎逐漸被削弱。不過，小榜在第一時間體驗過 Gemini 3 Pro 後發現，這款產品並未讓人失望。

目前的 AI 賽道已經不再僅僅依賴於參數量的競爭，業界正聚焦於應用、落地及成本的優化。Google 能否適應新版本和新環境，仍是一個未知數。

Gemini 3 Pro 的自我評價

當我要求 Gemini 3 Pro 用一句話形容自己時，它這樣回答：“不再急於向世界證明自己有多聰明，而是開始琢磨如何讓自己變得更有用。”——Gemini 3 Pro 在 LMArena 排行榜上以 1,501 的 Elo 分數登頂，創下 AI 模型在綜合能力評估中的新紀錄。這一成績相當優秀，就連奧特曼也在社交媒體上發表祝賀。

在數學能力測試中，該模型在 AIME2025（美國數學邀請賽）的代碼執行模式下達到了 100% 的準確率；在 GPQADiamond 科學知識測試中，Gemini 3 Pro 的準確率為 91.9%。MathArenaApex 數學競賽的測試結果顯示，Gemini 3 Pro 獲得了 23.4% 的得分，而其他主流模型的得分普遍在 2% 以下。此外，在名為 Humanity’s Last Exam 的測試中，該模型在不使用工具的情況下達到了 37.5% 的得分。

Google 在此次更新中引入了名為 “vibecoding” 的代碼生成功能，允許用戶通過自然語言描述需求，系統隨後生成相應的代碼和應用程序。

在 Canvas 編程環境的測試中，用戶描述“製作一個可以調節轉速的電風扇”後，系統在約 30 秒內生成了完整代碼，包括旋轉動畫、速度控制滑塊和開關按鈕。

在交互方式上，Gemini 3 Pro 增加了 “生成式界面”（Generative UI）功能，能根據查詢內容自動生成定制化的界面佈局。例如用戶詢問量子計算相關問題時，系統可能生成包含概念解釋、动态图表和相關論文鏈接的交互式界面。

此次發佈還包含了名為 Gemini Agent 的智能體系統，目前處於實驗階段。該系統可以執行多步驟任務，並連接到 Gmail、Google Calendar 和 Reminders 等 Google 服務。

在收件箱管理場景中，系統可以自動篩選郵件、標記優先級和起草回覆。旅行規劃方面，用戶只需提供目的地和大致時間，系統會查詢日曆、搜索航班和酒店選項，並添加行程安排，該功能目前僅向美國地區的 Google AI Ultra 訂閱用戶開放。

在多模態處理方面，Gemini 3 Pro 基於稀疏混合專家架構構建，支持文本、圖像、音頻和視頻輸入。模型的上下文窗口為 100 萬 token，意味著可以處理較長的文檔或視頻內容。加拿大勞瑞爾大學歷史學教授 Mark Humphries 的測試顯示，該模型在識別 18 世紀手寫文稿時的字符錯誤率為 0.

56%，相比前代版本降低了 50% 到 70%。

Google 表示，訓練數據包括公開網絡文檔、代碼、圖像、音頻和視頻內容，後訓練階段使用了強化學習技術。Google 還推出了名為 Gemini 3 Deep Think 的優化版本，專門用於複雜推理任務。該模式目前正在進行安全評估，計劃在未來幾周向 Google AI Ultra 訂閱者開放。

在 Google Search 的 AI 模式中，用戶可以點擊 “thinking” 選項卡查看該模式的推理過程。與標準模式相比，Deep Think 模式會在生成回答前進行更多步驟的分析。

除了官方提供的資料外，還將 Gemini 3 Pro 和 ChatGPT-5.1 進行了對比。在生成圖片方面，ChatGPT-5.1 在我提出的提示詞 “給我生成一張 iPhone 17” 的表現上更符合需求，因此這回合由 ChatGPT-5.1 胜出。

在智能體水平的對比中，提示詞為 “去給我研究研究字母榜這個微信公眾號，然後評論一下這個號的水平”。雖然主觀上更喜歡 Gemini 3 Pro 的解讀，但 ChatGPT-5.1 能更客觀地指出小榜的不足之處。

在代碼能力方面，選擇了 GitHub 上最近星數高的項目 LightRAG，這是一個通過整合圖結構來增強上下文感知和高效信息檢索的項目。

提示詞為 “跟我說說這個項目如何”。同時，Gemini 3 Pro 也獲得了業內人士的高度評價。

儘管 Gemini 3 Pro 發佈得相當低調，實際上 Google 已經為其預熱了相當長時間。Google CEO 皮查伊在第三季度財報電話會上曾提到：“Gemini 3 Pro 將在 2025 年內發佈。”雖然沒有具體日期和詳細信息，卻拉開了科技行業一場營銷大戲的序幕。

隨著 10 月的到來，各種“意外洩露”接踵而至。從 10 月 23 日開始流傳的日曆中，內部日曆截圖顯示了 “Gemini 3 Pro Release” 的消息。

此外，開發者在 Vertex AI 的 API 文檔中發現了 “gemini-3-pro-preview-11-2025” 的字樣，Reddit 和 X 上也出現各種截圖。

這些洩露似乎偶然，實則構成了一場精心編排的預熱，每次洩露都恰到好處地展示了 Gemini 3 Pro 的某項核心能力，進一步提升了期待值。Google 官方帳號的態度則顯得耐人尋味，他們會轉發社區的討論，使用“即將到來”的措辭來吊人胃口，但始終不肯透露具體的日期。

經過近一個月的預熱，Google 最終將 Gemini 3 Pro 推了出來。

然而，儘管 Gemini 3 Pro 性能強勁，但 Google 的更新頻率讓人有些焦急。早在今年 3 月，Google 就發佈了 Gemini 2.5 Pro 的預覽版本，隨後又推出了 Gemini 2.5 Flash 等衍生版本。直到 Gemini 3 Pro 問世，Gemini 系列在此期間並未有任何版本號的更新。

與此同時，Google 的競爭對手並不會等待 Gemini。OpenAI 在 8 月 7 日推出了 GPT-5，並在 11 月 12 日進一步升級至 GPT-5.1。此外，OpenAI 還推出了自己的 AI 瀏覽器 Atlas，直指 Google 的市場。

Anthropic 的迭代速度更為密集，從 2 月 24 日的 Claude 3.7 Sonnet 到 10 月 15 日的 Claude Haiku 4.5，這一系列的攻勢讓 Google 感到壓力。儘管目前看來，Google 似乎挺住了。

Google 耗時 8 個月才更新 Gemini 3 Pro 的原因，可能來自於人員的變更。2025 年 7 月至 8 月，Microsoft對 Google 發起了一波猛烈的人才攻勢，成功招募了 20 多名 DeepMind 的核心專家和高管，包括負責核心 AI 產品的高管和 Gemini 的核心工程負責人。

另外，Google Nano Banana 團隊曾表示，在發佈 Gemini 2.5 Pro 之後，他們一直在專注於 AI 生圖領域，這讓基座模型的更新進程放緩。Google 認為，只有成功攻克角色一致性、語境編輯和文字乱码這三個生成圖片領域的難題，才能讓基座模型的表現更佳。

回顧 Gemini 3 Pro，雖然它是一份合格的答卷，但在如今競爭激烈的 AI 戰場，僅僅及格早已不夠。Google 既然選擇在此時交卷，就必須面對最苛刻的評閱者，那些已被競品“喂刁”了口味的用戶和開發者。接下來的幾個月，將不是模型參數的比拼，而是生態整合能力的較量。

Google 這頭大象不僅要學會跳舞，還得跳得比所有人都快。

Google Gemini 3 Pro 發佈具備全新功能及高效能表現

Gemini 3 Pro 的自我評價

Henderson

搜尋文章