Google 的 Gemini 現在可以使用文字提示編輯 AI 生成的圖片和個人圖片。這些編輯工具允許進行精確的變更,並且 Gemini 現在支持一次上傳多達 10 張圖片或文件。
Google 的 Gemini AI 進行了一些重大的升級,現在可以直接在聊天界面內編輯圖片,並且用戶可以同時發送多張圖片或其他文件供其檢查。新的編輯器可以對任何上傳的圖片或由 Gemini 生成的圖片進行 AI 編輯。用戶只需告訴 Gemini 想要的修改內容。用戶可以將度假照片的背景換成聖托里尼懸崖上的景象,去掉外套上的芥末污漬,甚至為拒絕戴帽子的狗狗加上一頂搞笑的帽子。
在與 Gemini 的對話中,可以進行多次編輯,隨著進度堆疊變更。每次修改都會保留之前的變更,因此在決定最後幾次編輯使效果不佳時,不必從頭開始。
在技術上,Gemini 的編輯器運行著一組協同工作的工具,以避免出現視覺上的不協調。Gemini 承諾即使在用戶的想像力超越現實時,也能保持圖像的真實性。Google 表示,這個編輯器將對多種職業產生積極的影響。教師可以快速製作插圖故事板,設計師可以創建產品照片的作品集,建築師則可以在會議中可視化建築設計的調整。
這個編輯器與 Google 擴大 Gemini 單文件上傳限制的舉措相得益彰。現在用戶可以一次上傳多達十張圖片、PDF 或其他文件,並請求 Gemini 進行整理。
在考慮到 Gemini 的編輯器如何防止人們利用其能力製作不道德的深偽圖像時,Google 強調已經考慮到這一點。因此,每張 AI 編輯的圖片都會有兩個水印,一個是可見的,另一個則使用 Google 的 SynthID,僅能通過專用軟件檢測。此外,還有基於人類反饋的過濾器,阻止不道德的請求。
這個編輯器和擴大的上傳選項並未打破新紀元,但為 Gemini 增添了深度。這不僅僅是關於 Gemini 能告訴用戶什麼,而是它能幫助用戶創造什麼。Google 正在投入大量精力,將 Gemini 打造成一個全面、靈活的工具包,使人們感到放心地依賴。
Google 希望人們將 Gemini 視為創意和生產任務的夥伴,而不僅僅是一個具有幽默感的數字筆記工具或搜索引擎。雖然尚未達到可以要求 Gemini “設計一張生日卡並烤蛋糕”的地步,但這一目標已經變得更加接近。在此之前,能夠將十個文件發送給 Gemini,並獲得連貫的回應,同時還能為狗狗加上帽子,這已經是一個不錯的開始。
同場加映:香港無痛,不用 VPN 情況下使用 Google Gemini
【教學】如何在香港申請 Google Gemini 及訂閱 Google Gemini Advanced /
【整理】Google Gemini 語音指令:發 WhatsApp、開 Apps、打電話等等