阿里巴巴正式發佈新一代圖像生成及編輯模型 Qwen-Image-2.0。這款模型作為千問大模型的圖像生成基礎,將生圖和編輯功能結合在一起,在 AI Arena 文生圖評測中以 1029 分的成績超越了 Seedream 4.5、Flux 2-Max 等模型,僅次於 Google 的 Nano Banana Pro 和 GPT Image 1.5。
Qwen-Image-2.0 支持 1K token 的超長文字輸入和 2K 高分辨率,能夠準確渲染複雜指令,輕鬆生成專業的 PPT 及信息圖,質感媲美專業級攝影師。
此外,這款新模型在中文漢字渲染方面表現出色,數百字的古文全文幾乎都能完全渲染在圖片中。
在 Qwen-Image 和 Qwen-Image-Edit 兩大模型的基礎上全新升級,Qwen-Image-2.0 首次將圖像生成和編輯統一到一個模型中,以更輕量的模型架構實現了生圖和改圖性能的大幅提升。生圖質感尤其細膩,無論是老人皺紋的褶皺還是浩瀚宇宙的景象,模型生成的人物、自然、建築等常用圖片均極其逼真。
在權威評測 AI Arena 中,千問新模型在圖像生成中的得分為 1029,位列第三;在圖片編輯中得分 1034,僅次於 Nano Banana Pro。
在中文漢字渲染方面,Qwen-Image-2.0 顯示出極為突出的表現,不僅可以以多種字體準確渲染漢字,而且寫得多且準,效果超過 Nano Banana Pro。
千問新模型將輸入提示詞擴展到 1K token,能夠詳細描述任務,實現更專業的文字渲染,輕鬆應對專業 PPT、高級海報、多格漫畫等複雜圖片。例如,以小楷字體幾乎完全渲染《蘭亭集序》數百字的全文配圖,或是以自然語言生成論文格式配圖的複雜 PPT 等。
基於 Qwen-Image-2.0 模型,用戶可以與 AI 協同創作出更豐富、更實用的圖片,例如一句話生成宮保雞丁的做法流程圖、杭州兩日旅遊攻略圖、4×6 的多格漫畫組圖、兒童繪本圖,以及寫實風格的電影海報等。
此外,用戶還可以上傳數張圖片進行編輯,生成九宮格多手勢自拍、真人配字表情包、雙人逼真 AI 合影、詩詞配圖等多種作品。




