我試用了 Google 的新款 Nano Banana Pro,結果它立即讓我的衣服消失了。雖然我沒有要求,但這款 AI 模型顯然認為我的賀卡需要更多的裸露肌膚。
如其名,Nano Banana Pro 主要針對專業人士。它由 Gemini 3 驅動,實際上是該公司流行的圖像生成和編輯工具的升級版。這款工具曾在社交媒體上引發熱潮,將自拍照轉換為超寫實的 3D 雕像。Google 表示,這款工具能讓用戶創建更高品質的圖像,並能在圖片上渲染可讀的文本,還能將多張圖片合成為一個單一的作品。Google DeepMind 的產品經理 Naina Raisinghani 告訴 The Verge,這款工具也適合「希望感覺自己像專業人士的人」。聽起來不錯,因為我絕對不是專業人士。對我來說,結果雖然光鮮,但有些滑稽,看起來不錯,卻感覺業餘。
使用 Nano Banana Pro 非常簡單:打開 Gemini 應用程序,選擇「創建圖像」,然後開啟「思考」模式。只需輸入提示(如果使用圖片,則也上傳圖片)即可開始。這款工具免費使用,但有使用限制,Google AI Plus、Pro 和 Ultra 訂閱用戶的配額會有所擴大。
Google 做出了一些大膽的聲明,承諾提供「工作室級設計」、「完美的文本渲染」以及一系列創意編輯功能。為了測試這些功能,我上傳了一張自己在 New York 的 The Verge 辦公室附近的簡單照片,背景是布魯克林大橋。我請求 Gemini 將光線從白天轉換為夜晚,它做得相當不錯,結果看起來相當可信。它甚至處理了一些常常讓圖像生成器困惑的細節,比如汽車的行駛方向。
調整攝影角度同樣簡單。我請求 Gemini 以更高的角度重現這張照片,它也做到了。
| 功能 | 描述 | 價格 |
|---|
| 免費使用 | 基本功能 | $0 / 約 HK$ 0 |
| Google AI Plus | 擴大配額 | $9.99 / 約 HK$ 77.99 |
| Google AI Pro | 進階功能 | $19.99 / 約 HK$ 155.99 |
| Google AI Ultra | 所有功能 | $29.99 / 約 HK$ 233.99 |
Google 還表示,Nano Banana Pro 能創建信息圖和圖表,以幫助視覺化實時信息,如天氣或體育賽事。由於我身在英國,我詢問了華盛頓特區和紐約市未來四天的天氣。從視覺上看,這個信息圖就像在基本的預報網站上看到的那樣。文本和數字顯示正常,與 AI 生成的圖像中常見的亂碼截然不同,Gemini 還在最後提供了引用列表,幫助我確認其準確性。
在一些更複雜的任務上,這款模型表現得有些不如預期。我要求它以漫畫書風格總結最近一篇有關歐洲如何縮減 AI 和隱私法的 The Verge 文章。運用的圖像和文本確實用卡通字體完美渲染,但漫畫根本沒有總結該故事,而是對該區域的 AI 法案給出了模糊的概述。問題可能出在我給 Gemini 提供了一個鏈接,而不是直接粘貼文本。
當我直接提供文本時,它給出了可接受的漫畫風格總結。雖然它傳達了實際故事的要點,但如果沒有我撰寫的來源材料,我懷疑我能否輕易理解。它還編造了一些在我的文章中並不存在的短語。
考慮到聖誕節即將來臨,我試著製作賀卡。考慮到我只上傳了三張自拍,Gemini 創造出了三個完整的自己,穿著不同的服裝,表情各異,實在令人驚艷。它還根據我的要求創造了一個真實的雪景背景和聖誕樹,並在上方寫上了「聖誕快樂!」。
當我請求將賀卡的雪景背景改為澳大利亞風格的沙灘時,它卻顯得有些過於自由:我的兩個克隆體竟然都沒有上衣,這實在讓人感到奇怪。還有一些顯眼的 AI 生成的腳和一個微笑的沙子人,取代了冬季場景中的雪人。雖然畫面中的其他物體都有陰影,但沙子人卻缺少了陰影,並且棕櫚樹上的聖誕燈在明亮的陽光下神奇地發光。我測試了它的精確編輯技能,要求只為其中一個克隆體增加肌肉,它在幾秒鐘內完成了(如果現實中也如此簡單就好了)。總體而言,質量相當出色,這幅圖像在不知道胸口有一個大紋身的情況下,也會讓人感覺相當可信。
然而,並非所有的結果都令人滿意。該模型未能保留我要求的賀卡文本,結果變成了「澳洲夏季聖誕!」。它似乎對動物的處理也很吃力:我姐姐的貓在我提供的每個賀卡版本中都呈現出與參考圖像完全相同的僵硬姿勢(不過它戴上了可愛的聖誕帽)。
總的來說,Nano Banana Pro 是對基本模型的明顯升級。我能夠請求更精確的編輯,並且它能生成可理解的文本,這消除了生成型 AI 工具在現實世界中可用性的巨大障礙。不過,這些功能還不足以讓我成為一名優秀的設計師。