Google Gemini 3 Pro 發佈 具備全新功能及高效能表現

Google 正式發佈了 Gemini 3 Pro,這一消息來得相當突然,且相對低調。雖然在此之前,Google 推出了圖片編輯模型 Nano Banana,提升了一些存在感,但在基座模型方面,Google 靜默了過久。過去這大半年,業界更多討論的是 OpenAI 的新動作,或是 Claude 在代碼方面的表現,卻鮮有提及已經有 8 個月沒有版本號更新的 Gemini。

儘管 Google 的雲業務和財報表現不錯,但在 AI 開發者的核心圈子中,Google 的影響力似乎逐漸被削弱。不過,小榜在第一時間體驗過 Gemini 3 Pro 後發現,這款產品並未讓人失望。

目前的 AI 賽道已經不再僅僅依賴於參數量的競爭,業界正聚焦於應用、落地及成本的優化。Google 能否適應新版本和新環境,仍是一個未知數。

Gemini 3 Pro 的自我評價

當我要求 Gemini 3 Pro 用一句話形容自己時,它這樣回答:“不再急於向世界證明自己有多聰明,而是開始琢磨如何讓自己變得更有用。”——Gemini 3 Pro 在 LMArena 排行榜上以 1,501 的 Elo 分數登頂,創下 AI 模型在綜合能力評估中的新紀錄。這一成績相當優秀,就連奧特曼也在社交媒體上發表祝賀。

在數學能力測試中,該模型在 AIME2025(美國數學邀請賽)的代碼執行模式下達到了 100% 的準確率;在 GPQADiamond 科學知識測試中,Gemini 3 Pro 的準確率為 91.9%。MathArenaApex 數學競賽的測試結果顯示,Gemini 3 Pro 獲得了 23.4% 的得分,而其他主流模型的得分普遍在 2% 以下。此外,在名為 Humanity’s Last Exam 的測試中,該模型在不使用工具的情況下達到了 37.5% 的得分。

Google 在此次更新中引入了名為 “vibecoding” 的代碼生成功能,允許用戶通過自然語言描述需求,系統隨後生成相應的代碼和應用程序。

在 Canvas 編程環境的測試中,用戶描述“製作一個可以調節轉速的電風扇”後,系統在約 30 秒內生成了完整代碼,包括旋轉動畫、速度控制滑塊和開關按鈕。

在交互方式上,Gemini 3 Pro 增加了 “生成式界面”(Generative UI)功能,能根據查詢內容自動生成定制化的界面佈局。例如用戶詢問量子計算相關問題時,系統可能生成包含概念解釋、动态图表和相關論文鏈接的交互式界面。

此次發佈還包含了名為 Gemini Agent 的智能體系統,目前處於實驗階段。該系統可以執行多步驟任務,並連接到 Gmail、Google Calendar 和 Reminders 等 Google 服務。

在收件箱管理場景中,系統可以自動篩選郵件、標記優先級和起草回覆。旅行規劃方面,用戶只需提供目的地和大致時間,系統會查詢日曆、搜索航班和酒店選項,並添加行程安排,該功能目前僅向美國地區的 Google AI Ultra 訂閱用戶開放。

在多模態處理方面,Gemini 3 Pro 基於稀疏混合專家架構構建,支持文本、圖像、音頻和視頻輸入。模型的上下文窗口為 100 萬 token,意味著可以處理較長的文檔或視頻內容。加拿大勞瑞爾大學歷史學教授 Mark Humphries 的測試顯示,該模型在識別 18 世紀手寫文稿時的字符錯誤率為 0.

56%,相比前代版本降低了 50% 到 70%。

Google 表示,訓練數據包括公開網絡文檔、代碼、圖像、音頻和視頻內容,後訓練階段使用了強化學習技術。Google 還推出了名為 Gemini 3 Deep Think 的優化版本,專門用於複雜推理任務。該模式目前正在進行安全評估,計劃在未來幾周向 Google AI Ultra 訂閱者開放。

在 Google Search 的 AI 模式中,用戶可以點擊 “thinking” 選項卡查看該模式的推理過程。與標準模式相比,Deep Think 模式會在生成回答前進行更多步驟的分析。

除了官方提供的資料外,還將 Gemini 3 Pro 和 ChatGPT-5.1 進行了對比。在生成圖片方面,ChatGPT-5.1 在我提出的提示詞 “給我生成一張 iPhone 17” 的表現上更符合需求,因此這回合由 ChatGPT-5.1 胜出。

在智能體水平的對比中,提示詞為 “去給我研究研究字母榜這個微信公眾號,然後評論一下這個號的水平”。雖然主觀上更喜歡 Gemini 3 Pro 的解讀,但 ChatGPT-5.1 能更客觀地指出小榜的不足之處。

在代碼能力方面,選擇了 GitHub 上最近星數高的項目 LightRAG,這是一個通過整合圖結構來增強上下文感知和高效信息檢索的項目。

提示詞為 “跟我說說這個項目如何”。同時,Gemini 3 Pro 也獲得了業內人士的高度評價。

儘管 Gemini 3 Pro 發佈得相當低調,實際上 Google 已經為其預熱了相當長時間。Google CEO 皮查伊在第三季度財報電話會上曾提到:“Gemini 3 Pro 將在 2025 年內發佈。”雖然沒有具體日期和詳細信息,卻拉開了科技行業一場營銷大戲的序幕。

隨著 10 月的到來,各種“意外洩露”接踵而至。從 10 月 23 日開始流傳的日曆中,內部日曆截圖顯示了 “Gemini 3 Pro Release” 的消息。

此外,開發者在 Vertex AI 的 API 文檔中發現了 “gemini-3-pro-preview-11-2025” 的字樣,Reddit 和 X 上也出現各種截圖。

這些洩露似乎偶然,實則構成了一場精心編排的預熱,每次洩露都恰到好處地展示了 Gemini 3 Pro 的某項核心能力,進一步提升了期待值。Google 官方帳號的態度則顯得耐人尋味,他們會轉發社區的討論,使用“即將到來”的措辭來吊人胃口,但始終不肯透露具體的日期。

經過近一個月的預熱,Google 最終將 Gemini 3 Pro 推了出來。

然而,儘管 Gemini 3 Pro 性能強勁,但 Google 的更新頻率讓人有些焦急。早在今年 3 月,Google 就發佈了 Gemini 2.5 Pro 的預覽版本,隨後又推出了 Gemini 2.5 Flash 等衍生版本。直到 Gemini 3 Pro 問世,Gemini 系列在此期間並未有任何版本號的更新。

與此同時,Google 的競爭對手並不會等待 Gemini。OpenAI 在 8 月 7 日推出了 GPT-5,並在 11 月 12 日進一步升級至 GPT-5.1。此外,OpenAI 還推出了自己的 AI 瀏覽器 Atlas,直指 Google 的市場。

Anthropic 的迭代速度更為密集,從 2 月 24 日的 Claude 3.7 Sonnet 到 10 月 15 日的 Claude Haiku 4.5,這一系列的攻勢讓 Google 感到壓力。儘管目前看來,Google 似乎挺住了。

Google 耗時 8 個月才更新 Gemini 3 Pro 的原因,可能來自於人員的變更。2025 年 7 月至 8 月,Microsoft對 Google 發起了一波猛烈的人才攻勢,成功招募了 20 多名 DeepMind 的核心專家和高管,包括負責核心 AI 產品的高管和 Gemini 的核心工程負責人。

另外,Google Nano Banana 團隊曾表示,在發佈 Gemini 2.5 Pro 之後,他們一直在專注於 AI 生圖領域,這讓基座模型的更新進程放緩。Google 認為,只有成功攻克角色一致性、語境編輯和文字乱码這三個生成圖片領域的難題,才能讓基座模型的表現更佳。

回顧 Gemini 3 Pro,雖然它是一份合格的答卷,但在如今競爭激烈的 AI 戰場,僅僅及格早已不夠。Google 既然選擇在此時交卷,就必須面對最苛刻的評閱者,那些已被競品“喂刁”了口味的用戶和開發者。接下來的幾個月,將不是模型參數的比拼,而是生態整合能力的較量。

Google 這頭大象不僅要學會跳舞,還得跳得比所有人都快。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。