OpenAI 發佈 GPT-image-2 圖像生成模型擬真度大幅提升

OpenAI 近日推出最新圖像生成模型 GPT-image-2，目前仍處於灰度測試階段，尚未全面上線。該模型生成結果令人震驚，不再像傳統 AI 圖像那樣明顯可辨，而是高度逼真，宛如真實手機截圖。長期使用 AI 圖像工具的用戶，常會習慣性檢查細節，如人物手指畸形、眼神空洞、文字亂碼或光影不自然等破綻。過去 AI 圖像雖精緻，但往往過於光滑帶塑料感，或在邊角出現不合理元素，引發不真實或廉價印象。

測試簡單提示詞「生成一張女主播抖音截圖」，僅 11 字，即展現模型強大理解力。此非單純繪製美女，而是重現包含人物、直播間 UI、中文文字及手機截圖質感的完整數位場景。

人物與介面高度擬真

人物生成自然，面部、手部及身體結構無明顯缺陷，捕捉美顏燈光下的皮膚質感、妝容及背景虛化，符合真實直播日常感，而非過度完美。直播間布局精準，理解抖音介面規則：頭像、昵稱、滾動評論、互動按鈕及輸入框位置井然有序。對比真實截圖，元素排列合理，不似堆砌。中文文字處理大幅進步，評論區及按鈕文字正確可讀，貼合場景。雖字體偶有非標準渲染，但已非亂碼問題。規格對比如下：

項目	GPT-image-2	傳統 AI 模型
人物細節	自然手部、五官、光影真實	常見畸形、空洞眼神
介面布局	理解 App 規則，位置精準	元素堆砌，無序
中文文字	正確可讀，場景貼合	亂碼或扭曲
整體質感	手機截圖般像素統一	塑料感或不自然

模型挑剔細節需放大對比方能察覺，如比例或 UI 微差。此質變令圖像具真實感，挑戰圖片真偽判斷。用戶可於 Arena.ai 的 Battle 模式測試，匿名對戰或許遇上此測試版。OpenAI 以結果證明實力，Google 的 Gemini 亦面臨競爭。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

OpenAI 發佈 GPT-image-2 圖像生成模型擬真度大幅提升

人物與介面高度擬真

Henderson

搜尋文章

人物與介面高度擬真

相關文章

Henderson

搜尋文章