最新 Pixel 手機將生成式 AI 整合於相機中

在 The Verge,我們喜歡問「什麼是照片?」當我們試圖分辨真實與不真實的影像時,尤其是那些用手機相機拍攝的照片。不過,從現在開始,還有一個問題需要加入討論:什麼是相機?隨著 Pixel 10 Pro 和 Pro XL 的發佈,這個問題的答案變得更加複雜,因為生成式人工智能不僅僅是編輯已拍攝照片的工具,它已經深深融入了相機本身。

這裡提到的 Pro Res Zoom,與 Apple 的 ProRes 影像格式或 Google 的 Super Res Zoom 不同。Pro Res Zoom 在數位變焦超過 30 倍時啟用,最高可達 100 倍。通常,相機會使用算法填補在將小部分照片放大到原始解析度時留下的空隙。這樣的結果往往不盡人意,特別是在 75 倍或 100 倍的情況下,儘管過去二十年來每個相機製造商都付出了努力。Pro Res Zoom 旨在為之前無法獲得的場景提供可用的影像,而這正是擴散模型的作用所在。

Google 的 Pixel 相機產品經理 Isaac Reynolds 表示,這是一種潛在的擴散模型。他並不認為這是一個全新的過程,而更像是手機相機多年來所做的一種變體。算法長期以來一直在幫助識別主體並改善細節,隨之而來的則是一些不必要的伪影,工程師們在隨後的更新中會修正這些問題。「生成式人工智能只是一種不同的算法,會產生不同的伪影,」他說。但與傳統的神經網絡相比,擴散模型在消除伪影方面表現相當出色。

在我看到的幾個演示中,Pro Res Zoom 有效地清理了一些非常糟糕的 100 倍變焦照片。所有處理都在拍攝後的設備上進行。Reynolds 提到,當 Google 開始開發這一功能時,運行擴散模型需要大約一分鐘,而他的團隊將運行時間縮短至四到五秒。處理完成後,新的版本會與原始圖像一起保存。雖然我只見過它工作幾次,但結果看起來相當不錯。

Pro Res Zoom 有一個重要的限制:它不會對人像進行處理。如果圖像中檢測到人,該功能會繞過人像,增強其他部分,讓人像保持不變。這是一個好的設計,因為不希望手機相機在面部上生成不同的特徵,這在某種程度上也是出於對隱私的考慮。

Google 還負責任地對用手機拍攝的照片進行標記,使用 C2PA 內容證書,標註 Pro Res Zoom 的照片為「使用 AI 工具編輯」。不僅如此,所有用 Pixel 10 拍攝的照片都會被標註,表明它們是使用相機拍攝的,並且 AI 是否有參與。如果照片是合併多幀的結果,例如全景照片,這也會在內容證書中註明。

這一切都是為了減少「隱含真實效果」,Reynolds 解釋道。如果僅對 AI 生成的圖像進行標籤,那麼任何沒有 AI 標籤的圖像似乎都是真實的。但這只是意味著圖像的來源是未知的,尤其是在現在這個 AI 編輯和圖像生成工具輕鬆獲取的時代。它可能已經使用 AI 編輯過,但未被標註,或者標籤可能因截圖而被移除。

需要注意的是,C2PA 證書一旦創建,就無法修改。尋找標籤以確定圖像是由相機創建的,成為識別所見圖像是否為 AI 生成的唯一可靠方法。如果這是我們未來的方向,那麼目前的現實與未來之間存在著巨大的差距。

「我確實認為會有一段教育的過程,」Reynolds 承認。他認為這個階段已經開始,而他也同意這一點。但在那個未來到來之前,現在可能對人類和我們的機構造成真正的傷害,這使得當前的情況讓人感到不安。

使用 AI 來清理劣質變焦照片的相機是否仍然只是一部相機?目前來看,可能是的。不過,這為那些希望創造其他東西的人打開了一扇門,並且在此期間還有很多問題需要探討。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。