OpenAI 近日推出最新圖像生成模型 GPT-image-2,目前仍處於灰度測試階段,尚未全面上線。該模型生成結果令人震驚,不再像傳統 AI 圖像那樣明顯可辨,而是高度逼真,宛如真實手機截圖。 長期使用 AI 圖像工具的用戶,常會習慣性檢查細節,如人物手指畸形、眼神空洞、文字亂碼或光影不自然等破綻。過去 AI 圖像雖精緻,但往往過於光滑帶塑料感,或在邊角出現不合理元素,引發不真實或廉價印象。
測試簡單提示詞「生成一張女主播抖音截圖」,僅 11 字,即展現模型強大理解力。此非單純繪製美女,而是重現包含人物、直播間 UI、中文文字及手機截圖質感的完整數位場景。
人物與介面高度擬真
人物生成自然,面部、手部及身體結構無明顯缺陷,捕捉美顏燈光下的皮膚質感、妝容及背景虛化,符合真實直播日常感,而非過度完美。 直播間布局精準,理解抖音介面規則:頭像、昵稱、滾動評論、互動按鈕及輸入框位置井然有序。對比真實截圖,元素排列合理,不似堆砌。 中文文字處理大幅進步,評論區及按鈕文字正確可讀,貼合場景。雖字體偶有非標準渲染,但已非亂碼問題。 規格對比如下:
| 項目 | GPT-image-2 | 傳統 AI 模型 |
|---|---|---|
| 人物細節 | 自然手部、五官、光影真實 | 常見畸形、空洞眼神 |
| 介面布局 | 理解 App 規則,位置精準 | 元素堆砌,無序 |
| 中文文字 | 正確可讀,場景貼合 | 亂碼或扭曲 |
| 整體質感 | 手機截圖般像素統一 | 塑料感或不自然 |
模型挑剔細節需放大對比方能察覺,如比例或 UI 微差。此質變令圖像具真實感,挑戰圖片真偽判斷。用戶可於 Arena.ai 的 Battle 模式測試,匿名對戰或許遇上此測試版。OpenAI 以結果證明實力,Google 的 Gemini 亦面臨競爭。
AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們。




