Google 發佈 Nano Banana 2 Lite 及 Gemini Omni Flash 供開發者使用

Google 今日宣佈推出 Nano Banana 2 Lite 及 Gemini Omni Flash 的預覽版本,作為其最新的媒體生成模型,供開發者及 NotebookLM 用户使用。Nano Banana 2 Lite(正式名稱為 Gemini 3.1 Flash-Lite Image)是 Google 迄今為止「最快且最具成本效益的圖像生成及編輯模型」。

該模型今日正式推出,Google 旗下的技術宣稱可在 4 秒內生成圖像。與原版的 Nano Banana(Gemini 2.5 Flash Image)相比,這款新模型提供了「快速的圖像生成,並在視覺質素及能力上有顯著的提升」。

這款模型的能力包括:世界知識:快速草擬準確的情境場景、粗略的數據可視化及特定位置的模擬圖;角色一致性:在多次快速生成中保持角色身份及物件的真實性,以便輕鬆建立故事板工具或嵌入虛擬試衣間以促進電子商務;快速文本及本地化:即時草擬文案,透過快速生成直接渲染可讀的文本,觀察排版在本地廣告變化中的效果。

Gemini Omni Flash 現已公開預覽

同時,Gemini Omni Flash 現已進入公眾預覽階段。此舉緊接在 I/O 大會上宣佈的 Gemini 應用程式。該模型的功能包括:對話式編輯:使用自然語言交換角色、重新照明場景或改變角度,同時天然保持原始的音頻和視頻軌道;多模態輸入:結合文本、圖像和視頻輸入來指導視頻生成。Gemini Omni Flash 在每個視頻輸出中原生生成音頻,同時保持角色、物體和風格的一致性。

此外,該模型的世界知識和模擬能力結合了對物理的直觀理解與 Gemini 的歷史、科學及文化背景知識,從而在照片寫實主義與意義深遠的敍事之間架起橋樑。文本和動作同步功能可直接將可讀文本和圖形渲染入視頻中,將動態排版和解釋文本與螢幕運動同步。

Gemini Omni Flash 的定價與 Veo 3.1 Fast 相同,每秒 720p 視頻輸出收費為 US$0.10 (約 HK$1)。這兩款模型現已在 Google AI Studio 和 Gemini Enterprise Agent Platform 上推出。NotebookLM 正在使用 Nano Banana 2 Lite 進行短視頻概述。

這一新格式提供了 60 秒的豎屏視頻,內含「敍事解釋和教育動畫」,類似於 Cinematic Video Overviews,並將於未來幾周內推出。

Henderson
Henderson

Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。

友情網站:日本語版 / TechNipponThe Base Principle(AI・工程)