OpenAI 發佈 GPT Image 2 當天,三榜通殺。該模型上線 12 小時,Text-to-Image(文生圖)、Single-Image Edit(單圖編輯)、Multi-Image Edit(多圖編輯)三個分榜全數登頂。Arena 官方原話:「a clean sweep」(全勝)。文生圖主榜,GPT Image 2 得 1512 分,Nano Banana 2 僅 1271 分,241 分差距為 Arena 史上最大。
「沒有任何模型曾以這種差距統治過 Image Arena」,Arena 官方表示。在 Image Arena 所有盲測對決中,GPT Image 2 勝率達 93%:100 張圖配對盲選,93 張人們選了 OpenAI 那張。 「如果把 DALL-E 看作洞穴壁畫,把 Images 1.0 視為古代藝術,那 Images 2.0 就是文藝復興。」OpenAI 在發佈會開場如此介紹 Images 2.
0,奧特曼更將其稱為跨代升級,好比從 GPT-3 躍升至 GPT-5。OpenAI 官方 API 文件對 Images 2.0 給出最高評價。但真正厲害之處,並不在數據上。
Google 壓制半年,OpenAI 總算扳回一城
被 Google 壓了半年,OpenAI 終於反擊,時空倒回 2025 年 8 月。Google 推出 Nano Banana,這款嵌入 Gemini 的圖像生成模型,在 C 端瞬間引爆。三個月後的 Q3 財報會上,Google CEO Sundar Pichai 親口公布一組數字:Gemini 月活,從 7 月的 4.5 億升至 10 月的 6.5 億。Google Labs 負責人 Josh Woodward 稱,這增長很大程度來自 Nano Banana 帶動的圖像生成熱潮。
11 月,Google 再發 Nano Banana Pro,文字渲染能力驚艷,AI 圖像首次能寫對字,OpenAI 在 C 端被反超。11 月 18 日,Google 再補一刀,Gemini 3 發佈即登頂 LM Arena,得 1501 分,首個突破 1500 的前列模型。 這一個月尾,奧特曼對全公司發了「code red」(紅色警報)的內部備忘錄。據 The Information 報導,奧特曼私下告誡員工,Gemini 3 可能給 OpenAI 帶來經濟逆風。
Yahoo Finance 後續揭露:code red 下,OpenAI 暫停 AI Agent 等其他產品研發,資源全傾注 ChatGPT。12 月,OpenAI 倉促拿出 GPT Image 1.5,Arena 第一,但 C 端沒能引爆。2026 年 2 月,Google 再補一刀,Nano Banana 2 登場,Arena 再度領先。OpenAI 又輸一次。
直到 4 月 21 日,GPT Image 2 上線,OpenAI 才實現反超,重奪一城。 GPT Image 2 何以領先 241 分?核心答案藏在架構層面。GPT Image 2 不是 Stable Diffusion 那一代的擴散模型。OpenAI 研究負責人 Boyuan Chen 稱,這是「revamped from scratch」(從零重構)的「generalist model」(通用模型),OpenAI 內部叫法是「圖像版的 GPT」。
但 Chen 在新聞簡報時拒絕公開承認是擴散還是自迴歸架構。外界普遍解讀為「帶推理規程的圖像生成系統」:畫之前先規劃,再下筆。這正是 GPT Image 2 與上代圖像模型最大不同。OpenAI 在官方說明中給它一個新標籤:首個具原生思考能力的圖像模型(image model with native thinking capabilities)。畫之前先想、畫完自我檢查、需要時上網搜資料、一次能出 8 張前後連貫的圖。
這不是畫筆,是會思考的視覺助手。 以下為 Arena 單分項數據,以表格呈現:
| 分項 | GPT Image 2 提升(較前代) |
|---|---|
| 文字渲染(Text Rendering) | +316 分 |
| 卡通動漫和人像 | 各 +296 分 |
| 3 個產品/3D/寫實分項 | 整體 +247 至 +277 分區間 |
文字渲染是 2025 年 11 月 Nano Banana Pro 首次解決的難題,當時準確率 94%。GPT Image 2 推到 99%。OpenAI 發佈會現場演示:讓 GPT Image 2 畫一碗米飯,其中僅一粒米上寫有模型名稱。具體能力展現,OpenAI CTO Greg Brockman 在個人 X 帳號上做了示範。第一個案例,老照片修復。太空發黃的家庭老照片,一句提示詞,立馬變高飽和色彩版。
OpenAI 官方 API 文件中那句「high-fidelity image inputs」(高保真圖像輸入),說的就是模型對原圖細節的保留能力:輸入端能精準讀取太空的、破損的、模糊的老照片細節,輸出端才能重新渲染出鮮活版。 第二個案例中,Brockman 轉發用戶 @doodlestein 的一組測試圖:用同一個複雜提示詞讓 GPT Image 2 畫一張數學解說圖。
他評價說,即便複雜提示詞,GPT Image 2 也能生成風格各異的圖。@doodlestein 測試 GPT Image 2 用同一個提示詞畫一張線性代數解說圖,模型一口氣畫出 4 個完全不同的版本:同樣是 Mona Lisa + 特徵向量教學,每個版本的構圖、配色、資訊密度完全不同。這個案例真正價值不在「能畫數學圖」,而在解決過去兩年 AI 生圖的一個重要痛點:輸出單一、變化可控性差。
GPT Image 2 首次讓「一個 prompt 給我 4 個完全不同的方向」成為產品級能力。一位 LM Arena 資深測試者點評:GPT Image 2 與 Nano Banana Pro 的差距,跟 Nano Banana Pro 與 DALL-E 的差距一樣大。跨了整整一代。 GPT Image 2 Thinking 模式生成的 manga 風格漫畫頁:從一個簡單提示詞出發,模型保持角色一致性、刻畫多格情節。
DALL-E 退位,Adobe Canva 被逼到牆角。發佈當天,下游工具整合速度比科技圈預期的還快。Figma、Canva、Adobe Firefly、fal、Hermes Agent,全在 4 月 21 日當天完成整合。API 定價更是暗藏殺機:高質量出圖 US$0.21 一張,約 HK$1.64;ChatGPT Plus US$20 一個月,約 HK$156,圖像生成已包含在套餐內。
這個差價背後,可能帶來 2026 年圖像生成行業最大產能重組。 GPT Image 2 生成的 photorealistic candid(寫實抓拍)。海灘、陰天、復古車、膠片質感——這種過去要專業攝影師外拍 + 後期才能達到的視覺效果,如今 API US$0.21 一張。OpenAI 研究員 Gabriel Goh 說,photorealism 是他對這個模型最驕傲的能力。
5 月 12 日,DALL-E 2 和 DALL-E 3 正式退役。它們是 2022 年開啟整個 AIGC 視覺革命的開山祖師。三 年後,被 OpenAI 自家繼任者,親手送進歷史。 OpenAI 在官方發佈說明中提到:圖像不是玩具,是語言。一張好圖做的事和一句好話一樣:選擇、排列、呈現。這代表一種產品哲學轉向。當然,也不是沒有反方聲音。ZDNet 在實測中發現,GPT Image 2 無法準確複製商標 logo,連 ZDNet 自己的 logo 都被畫歪。
Nano Banana 2 在 portrait realism 和 multi-reference 一致性上仍有優勢。GPT Image 2 仍不夠完美,但競爭格局已出現變化。 渲染時代結束了,推理時代才開始。Google 把推理塞進圖像模型裡。OpenAI 把圖像工具塞進推理模型裡。242 分 Elo 差距測量的,就是兩個架構上的差異。implicator.
ai 有句評價,劃分了圖像生成的兩個時代。2022 至 2025 年,是渲染時代。DALL-E、Midjourney、Stable Diffusion,目標是「畫得像」。模型是畫筆,用戶是畫師,prompt 是畫布。 GPT Image 2 代表的是一個推理時代。模型先思考再下筆,能搜尋、能自檢、能完成任務。它不是畫筆,是會畫畫的助手。GPT Image 2 發佈真正值得重視的,是圖像生成走向「會思考」這件事本身。
短期看,Black Forest Labs(Flux 2)麻煩最大。Kingy AI 直言:作為 diffusion-first(擴散為先)的厂商,Flux 2 的整條技術水線在架構上和「token-by-token」的推理路徑是衝突的。要麼融合,要麼重寫,沒有第三條路。 中期看,Google 可能在下個季度反擊。Nano Banana 3,或 Imagen-Reason,時間不會太晚。
長期看,這件事影響遠不止圖像生成。當 AI 開始用「思考」來產生圖像、視頻、音樂、代碼,整個生成式 AI 的範式都會跟著發生變化。去年 12 月,奧特曼在備忘錄裡寫下「code red」的時候,應該沒想到五個月後會以這種方式重返 Arena 榜首。但這次反殺的真正意義,或許不是 OpenAI 贏了 Google,而是 OpenAI 改寫了圖像生成競技場的規則。
Arena.AI 單圖編輯榜(Image Edit Arena):GPT Image 2 (medium) 仍以 1510+ 分持續登頂,第二、三、四、五名全被 OpenAI 自家模型和 Google Gemini 系列壓制。Google 下一拳什麼時候出?這個問題決定了 2026 下半年 AI 格局的走向。而在那一拳打出來之前,GPT Image 2 會在 Arena 榜首坐多久,沒人知道。




