Google 發佈了其最新的圖像生成模型 Nano Banana Pro,這一升級版本在圖像編輯能力、高解析度、文字渲染精度及網絡搜索功能上均有顯著提升。該模型是基於 Google 本週早些時候推出的最新大語言模型 Gemini 3 開發而成。
新功能與性能
與前一代 Nano Banana 相比,Nano Banana Pro 能夠生成更細緻的畫面和更準確的文字,並支持以不同風格、字體和語言生成文本內容。Google 展示的示例圖片顯示,Nano Banana Pro 可以生成有關如何製作小豆蔻奶茶(elaichi chai)的信息圖。
新模型具備網頁搜索能力,使用者可以讓它先在網上查找食譜,然後基於搜索結果生成學習卡片等內容。Google 表示,Nano Banana Pro 更加偏向專業用戶,強調對圖像的精細控制。用戶可以調節相機角度、場景光線、景深、對焦及色彩分級等多項參數。與上一代 Nano Banana 的最高 1,024×1,024 像素分辨率相比,Nano Banana Pro 支持生成高達 2K 或 4K 分辨率的圖像。
然而,Google 也指出,儘管提供了更高質量的圖像,Nano Banana Pro 的生成速度較慢,成本亦高於前代。
此前,Nano Banana 生成一張 1,024 像素圖像的價格為 0.039 美元,約 HK$ 42.51,而 Nano Banana Pro 生成一張 1,080p 或 2K 圖像的價格為 0.139 美元,約 HK$ 151.81,生成一張 4K 圖像的價格則為 0.24 美元,約 HK$ 261.60。
在生成能力方面,新模型最多可以利用 6 張高保真的照片進行生成,或在同一圖像中融合多達 14 個對象,同時能保持畫面中最多 5 個人物的一致性和相似度。Google 已經上線一款演示應用,使用者可以在其中體驗這些功能。
在產品整合方面,Nano Banana Pro 正在逐步接入 Google 現有的多款 AI 工具。Gemini 應用將默認使用這一新模型進行圖像生成,不過,免費訂閱用戶可使用 Nano Banana Pro 生成的圖片數量有限,超出額度後將自動切回原始 Nano Banana 模型。付費的 Google AI Plus、Pro 和 Ultra 訂閱用戶將獲得更高的生成配額,但 Google 並未披露具體上限。此外,這些訂閱用戶還可以在 Notebook LM 中調用該模型。
另外,Goo
gle 還將在搜索產品中,向美國地區的 AI Pro 和 Ultra 訂閱用戶,在「AI 模式」下提供 Nano Banana Pro 支持;Ultra 用戶還可在公司的視頻工具 Flow 中調用該模型,企業 Workspace 客戶則可以在 Google Slides 和 Vids 中使用 Nano Banana Pro。
對於開發者而言,Nano Banana Pro 可以通過 Gemini API、Google AI Studio 以及 Google 新推出的集成開發環境(IDE)Antigravity 進行訪問和調用。
在安全與標識方面,Google 宣布將把 AI 圖像水印技術 SynthID 集成進 Gemini 應用,使用者可以上傳圖片,由聊天機器人判斷該圖像是否由 Google 的圖像模型生成或經過其模型修改。Google 並未透露是否計劃支持諸如 C2PA 等其他 AI 水印標準。