OpenAI Images 2 上線 12 小時三分榜全登頂壓制 Google Nano Banana

OpenAI 發佈 GPT Image 2 當天，三榜通殺。該模型上線 12 小時，Text-to-Image（文生圖）、Single-Image Edit（單圖編輯）、Multi-Image Edit（多圖編輯）三個分榜全數登頂。Arena 官方原話：「a clean sweep」（全勝）。文生圖主榜，GPT Image 2 得 1512 分，Nano Banana 2 僅 1271 分，241 分差距為 Arena 史上最大。

「沒有任何模型曾以這種差距統治過 Image Arena」，Arena 官方表示。在 Image Arena 所有盲測對決中，GPT Image 2 勝率達 93%：100 張圖配對盲選，93 張人們選了 OpenAI 那張。「如果把 DALL-E 看作洞穴壁畫，把 Images 1.0 視為古代藝術，那 Images 2.0 就是文藝復興。」OpenAI 在發佈會開場如此介紹 Images 2.0，奧特曼更將其稱為跨代升級，好比從 GPT-3 躍升至 GPT-5。OpenAI 官方 API 文件對 Images 2.0 給出最高評價。但真正厲害之處，並不在數據上。

Google 壓制半年，OpenAI 總算扳回一城

被 Google 壓了半年，OpenAI 終於反擊，時空倒回 2025 年 8 月。Google 推出 Nano Banana，這款嵌入 Gemini 的圖像生成模型，在 C 端瞬間引爆。三個月後的 Q3 財報會上，Google CEO Sundar Pichai 親口公布一組數字：Gemini 月活，從 7 月的 4.5 億升至 10 月的 6.5 億。Google Labs 負責人 Josh Woodward 稱，這增長很大程度來自 Nano Banana 帶動的圖像生成熱潮。

11 月，Google 再發 Nano Banana Pro，文字渲染能力驚艷，AI 圖像首次能寫對字，OpenAI 在 C 端被反超。11 月 18 日，Google 再補一刀，Gemini 3 發佈即登頂 LM Arena，得 1501 分，首個突破 1500 的前列模型。這一個月尾，奧特曼對全公司發了「code red」（紅色警報）的內部備忘錄。據 The Information 報導，奧特曼私下告誡員工，Gemini 3 可能給 OpenAI 帶來經濟逆風。

Yahoo Finance 後續揭露：code red 下，OpenAI 暫停 AI Agent 等其他產品研發，資源全傾注 ChatGPT。12 月，OpenAI 倉促拿出 GPT Image 1.5，Arena 第一，但 C 端沒能引爆。2026 年 2 月，Google 再補一刀，Nano Banana 2 登場，Arena 再度領先。OpenAI 又輸一次。

直到 4 月 21 日，GPT Image 2 上線，OpenAI 才實現反超，重奪一城。 GPT Image 2 何以領先 241 分？核心答案藏在架構層面。GPT Image 2 不是 Stable Diffusion 那一代的擴散模型。OpenAI 研究負責人 Boyuan Chen 稱，這是「revamped from scratch」（從零重構）的「generalist model」（通用模型），OpenAI 內部叫法是「圖像版的 GPT」。

但 Chen 在新聞簡報時拒絕公開承認是擴散還是自迴歸架構。外界普遍解讀為「帶推理規程的圖像生成系統」：畫之前先規劃，再下筆。這正是 GPT Image 2 與上代圖像模型最大不同。OpenAI 在官方說明中給它一個新標籤：首個具原生思考能力的圖像模型（image model with native thinking capabilities）。畫之前先想、畫完自我檢查、需要時上網搜資料、一次能出 8 張前後連貫的圖。

這不是畫筆，是會思考的視覺助手。以下為 Arena 單分項數據，以表格呈現：

分項	GPT Image 2 提升（較前代）
文字渲染（Text Rendering）	+316 分
卡通動漫和人像	各 +296 分
3 個產品/3D/寫實分項	整體 +247 至 +277 分區間

文字渲染是 2025 年 11 月 Nano Banana Pro 首次解決的難題，當時準確率 94%。GPT Image 2 推到 99%。OpenAI 發佈會現場演示：讓 GPT Image 2 畫一碗米飯，其中僅一粒米上寫有模型名稱。具體能力展現，OpenAI CTO Greg Brockman 在個人 X 帳號上做了示範。第一個案例，老照片修復。太空發黃的家庭老照片，一句提示詞，立馬變高飽和色彩版。

OpenAI 官方 API 文件中那句「high-fidelity image inputs」（高保真圖像輸入），說的就是模型對原圖細節的保留能力：輸入端能精準讀取太空的、破損的、模糊的老照片細節，輸出端才能重新渲染出鮮活版。第二個案例中，Brockman 轉發用戶 @doodlestein 的一組測試圖：用同一個複雜提示詞讓 GPT Image 2 畫一張數學解說圖。

他評價說，即便複雜提示詞，GPT Image 2 也能生成風格各異的圖。@doodlestein 測試 GPT Image 2 用同一個提示詞畫一張線性代數解說圖，模型一口氣畫出 4 個完全不同的版本：同樣是 Mona Lisa + 特徵向量教學，每個版本的構圖、配色、資訊密度完全不同。這個案例真正價值不在「能畫數學圖」，而在解決過去兩年 AI 生圖的一個重要痛點：輸出單一、變化可控性差。

GPT Image 2 首次讓「一個 prompt 給我 4 個完全不同的方向」成為產品級能力。一位 LM Arena 資深測試者點評：GPT Image 2 與 Nano Banana Pro 的差距，跟 Nano Banana Pro 與 DALL-E 的差距一樣大。跨了整整一代。 GPT Image 2 Thinking 模式生成的 manga 風格漫畫頁：從一個簡單提示詞出發，模型保持角色一致性、刻畫多格情節。

DALL-E 退位，Adobe Canva 被逼到牆角。發佈當天，下游工具整合速度比科技圈預期的還快。Figma、Canva、Adobe Firefly、fal、Hermes Agent，全在 4 月 21 日當天完成整合。API 定價更是暗藏殺機：高質量出圖 US$0.21 (約 HK$1)；ChatGPT Plus US$20 (約 HK$156)，圖像生成已包含在套餐內。

這個差價背後，可能帶來 2026 年圖像生成行業最大產能重組。 GPT Image 2 生成的 photorealistic candid（寫實抓拍）。海灘、陰天、復古車、膠片質感——這種過去要專業攝影師外拍 + 後期才能達到的視覺效果，如今 API US$0.21 (約 HK$2) 一張。OpenAI 研究員 Gabriel Goh 說，photorealism 是他對這個模型最驕傲的能力。

5 月 12 日，DALL-E 2 和 DALL-E 3 正式退役。它們是 2022 年開啟整個 AIGC 視覺革命的開山祖師。三年後，被 OpenAI 自家繼任者，親手送進歷史。 OpenAI 在官方發佈說明中提到：圖像不是玩具，是語言。一張好圖做的事和一句好話一樣：選擇、排列、呈現。這代表一種產品哲學轉向。當然，也不是沒有反方聲音。ZDNet 在實測中發現，GPT Image 2 無法準確複製商標 logo，連 ZDNet 自己的 logo 都被畫歪。

Nano Banana 2 在 portrait realism 和 multi-reference 一致性上仍有優勢。GPT Image 2 仍不夠完美，但競爭格局已出現變化。渲染時代結束了，推理時代才開始。Google 把推理塞進圖像模型裡。OpenAI 把圖像工具塞進推理模型裡。242 分 Elo 差距測量的，就是兩個架構上的差異。implicator.

ai 有句評價，劃分了圖像生成的兩個時代。2022 至 2025 年，是渲染時代。DALL-E、Midjourney、Stable Diffusion，目標是「畫得像」。模型是畫筆，用戶是畫師，prompt 是畫布。 GPT Image 2 代表的是一個推理時代。模型先思考再下筆，能搜尋、能自檢、能完成任務。它不是畫筆，是會畫畫的助手。GPT Image 2 發佈真正值得重視的，是圖像生成走向「會思考」這件事本身。

短期看，Black Forest Labs（Flux 2）麻煩最大。Kingy AI 直言：作為 diffusion-first（擴散為先）的厂商，Flux 2 的整條技術水線在架構上和「token-by-token」的推理路徑是衝突的。要麼融合，要麼重寫，沒有第三條路。中期看，Google 可能在下個季度反擊。Nano Banana 3，或 Imagen-Reason，時間不會太晚。

長期看，這件事影響遠不止圖像生成。當 AI 開始用「思考」來產生圖像、視頻、音樂、代碼，整個生成式 AI 的範式都會跟著發生變化。去年 12 月，奧特曼在備忘錄裡寫下「code red」的時候，應該沒想到五個月後會以這種方式重返 Arena 榜首。但這次反殺的真正意義，或許不是 OpenAI 贏了 Google，而是 OpenAI 改寫了圖像生成競技場的規則。

Arena.AI 單圖編輯榜（Image Edit Arena）：GPT Image 2 (medium) 仍以 1510+ 分持續登頂，第二、三、四、五名全被 OpenAI 自家模型和 Google Gemini 系列壓制。Google 下一拳什麼時候出？這個問題決定了 2026 下半年 AI 格局的走向。而在那一拳打出來之前，GPT Image 2 會在 Arena 榜首坐多久，沒人知道。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

OpenAI Images 2 上線 12 小時三分榜全登頂壓制 Google Nano Banana

Google 壓制半年，OpenAI 總算扳回一城

Henderson

搜尋文章

Google 壓制半年，OpenAI 總算扳回一城

相關文章

Henderson

搜尋文章