Google 推出 Nano Banana 2 Lite 與 Gemini Omni Flash 以促進創意開發

Google 官方宣布推出 Nano Banana 2 Lite,這是其最快、最具成本效益的 Gemini 圖像模型,並同時推出 Gemini Omni Flash 以支持高質量的影片生成和對話編輯。這兩項重大發布旨在簡化開發者的實驗和擴展流程。

Nano Banana 2 Lite 的推出及其特點

Nano Banana 2 Lite 是 Nano Banana 系列中最快且最具成本效益的圖像模型,專為高吞吐量、速度和擴展性而設計。該模型現已在 Google AI Studio、Gemini API 和 Gemini Enterprise Agent Platform 上提供,並將在 Google 消費者平台上推出,包括搜索的 AI 模式、Gemini 應用程式等。

「我們正在使實驗、精煉和擴展創意的過程變得更快、更容易。」

Google

Nano Banana 2 Lite 的設計重點在於快速的文本到圖像輸出,延遲僅需 4 秒,適合互動原型和快速視覺草圖的需求。其成本效益為每千張圖像僅需 0.034 美元,對於專注於草擬和管理預算的開發者來說,是一個理想的選擇。

Gemini Omni Flash 的功能與應用

Gemini Omni Flash 是一個高質量、具成本效益的影片生成和對話編輯模型,首次在 Google AI Studio 和 Gemini API 上推出。該模型支持從文本、圖像和影片輸入中生成高質量的影片,並且定價為每秒 0.10 美元,與 Veo 3.1 Fast 相同。

「Gemini Omni Flash 結合了 Gemini 的多模態推理和影片生成與編輯的能力。」

Google

Omni Flash 的特點包括使用自然語言進行對話式影片編輯、多模態參考以及實時知識的應用。該模型目前支持 10 秒的影片生成,未來將推出更長的影片時長。

結合兩個模型以實現創意工作流程

開發者可以將 Nano Banana 2 Lite 與 Gemini Omni Flash 結合使用,以便在高效生成圖像後,將這些圖像轉換為高質量的影片。Google 亦提供了一些示範應用程式,幫助開發者體驗如何將這兩個模型整合到工作流程中。

「真實的魔法在於將這些模型鏈接在一起。」

Google

這些新模型的推出不僅提升了開發者的創作能力,還通過 Google 的安全基礎設施確保了內容的安全性和透明度。開發者可在 Google AI Studio 中開始實驗,並深入了解 Gemini API 文檔以獲取更多資訊。

資料來源:Google 官方公告

十斗
十斗

十斗是 TechRitual Hong Kong 科技記者,擁有計算機科學與工程學位,專注報導 AI 人工智能、Google、機器學習及數據科學領域。持續追蹤全球 AI 產業動態,為讀者提供深入淺出的科技分析。

友情網站:日本語版 / TechNipponThe Base Principle(AI・工程)