Google 新推出 Gemini AI 照片轉視頻功能

Google 最近推出了一項新的 Gemini AI 功能,允許用戶將照片轉換為視頻片段。這項新的照片轉視頻能力是基於 Google 的 Veo 3 視頻模型,能夠將參考圖像轉換為長達八秒的視頻,並配有 AI 生成的音頻,包括背景噪音、環境聲音和對話。

根據 Google 的說法,這項 Gemini 視頻更新目前已向 Google AI Ultra 和 Pro 訂閱用戶在「特定地區」推出,並將在本週內逐步在網絡和移動設備上推出。

用戶可以通過點擊提示欄中的「工具」選項,選擇「視頻」,然後上傳照片並附上描述其運動方式的文字來訪問這項功能。音頻描述也可以用於對話、音效和環境噪音,Google 表示這些音頻將與視覺效果「完美同步」。生成的視頻將以 MP4 格式交付,分辨率為 720p,並採用 16:9 橫向格式。

Google 表示:「用戶可以通過為日常物品添加動畫、讓畫作和繪畫栩栩如生,或為自然場景增添動感來發揮創意。」所有生成的視頻都會包含可見水印以顯示它們是 AI 生成的,還有一個不可見的 SynthID 數字水印。

類似的功能已在 Google 於三月推出的生成性 AI 影片製作工具 Flow 中提供,但現在 Gemini 用戶可以在不打開其他應用的情況下為其照片添加動畫。Google 還表示,Flow 將在今天同時在「另外 75 個國家」推出,並推出 Gemini 的新視頻功能。

同場加映:香港無痛,不用 VPN 情況下使用 Google Gemini

【教學】如何在香港申請 Google Gemini 及訂閱 Google Gemini Advanced /
【整理】Google Gemini 語音指令:發 WhatsApp、開 Apps、打電話等等


十斗https://www.techritual.com/author/tenten/
十斗在知名大學取得了計算機科學與工程學位,並在學術研究方面表現出色。她的研究領域包括人工智能、機器學習和數據科學。一斗為十升,一升為十合,一合為十分之一升。謝靈運言天下才學一石,曹植占八斗,以此讚譽。後用以比喻才學極高。