現代 AI 圖像生成器正迅速進化,早期的明顯破綻——例如畸形的手腳、亂七八糟的文字、怪異的畫面噪點——正逐漸被工程手段抹平。現今,許多合成圖片已足以騙過普通人的肉眼,在社交媒體上不加控制地傳播。然而,發表在《科學》(Science)期刊上的一項研究指出,這些模型在本質上依然「不了解」現實世界中光線和幾何的運行方式,物理規律正成為識別真偽圖像最可靠的工具之一。
研究者指出,只要測量反射、陰影、透視線等看似細枝末節的部分,就仍有機會拆穿一張看似完美的 AI 照片。這種基於物理世界一致性的核查方法,被數字取證專家視為在「深度偽造」時代區分真實照片與 AI 偽造的重要防線。 早期的鑑別往往依賴肉眼捕捉粗糙的技術瑕疵,但隨著生成質量提升,圖像開始越來越符合人類對「真實」的主觀期待——色彩鮮明、構圖戲劇化、充滿電影感,這種「被製造出的戲劇性」反而讓人更容易放鬆警惕。
加州大學伯克利分校教授、被廣泛視為數字取證領域奠基人之一的 Hany Farid,一直在利用 AI 圖像的另一種「隱性弱點」。他的方法不是去尋找明顯的視覺錯誤,而是把生成圖跟現實世界中應當出現的幾何關係進行逐一對照。在他看來,現有的圖像生成模型尚未真正學會美術課上的基礎概念——消失點。
基於幾何與光線的驗真方法
以一張 AI 生成的「士兵在長廊中行進」的圖片為例,圖中可以看到一些顯而易見的缺陷,比如牆上模糊難辨的文字、莫名其妙的鏈條等。但更關鍵的線索藏在地面的瓷磚裡:按照透視原理,現實中的平行線(例如地磚縫、木地板接縫)在畫面中應當延伸並匯聚到同一個消失點。如果用直線工具沿著這些結構畫線,就可以檢查它們是否像真實照片那樣在遠方交匯,從而初步判斷圖像是否可信。類似的幾何關係同樣適用於反射。
研究指出,儘管今天的生成模型已能合成足以蒙混人眼的水面或鏡面反射,只要拿直尺量一量,問題就會暴露出來。在真實世界中,物體某一點與其在反射中的對應點之間連線,應當彼此平行,並在延長後指向一致的消失點;一旦這些線條出現不該有的偏差,就很可能意味著這是一張合成圖。 陽光投下的陰影也為這種測試提供了額外抓手。由於太陽距離地球極其遙遠,可以近似認為照射到地面的陽光是平行光線。
在這種前提下,物體某個點與其陰影中對應點之間的連線,同樣應該能夠延長並匯聚於一個消失點。如果一張照片中,不同物體的陰影線無法指向一致的幾何關係,則很可能違背了光學基本規律。目前還很難預測生成式模型何時、以及能否在根本上克服這些物理層面的錯誤。相比早期那些肉眼易辨的瑕疵,基於透視和光線的「幾何驗真」要求觀察者花費更多時間和精力,遠超一般社交媒體用戶的日常警惕閾值。
一些研究者甚至認為,對這種物理規則的深刻掌握,可能已超出當前主流生成模型的設計能力範圍。 在這項工作之外,專家也提醒用戶對「用 AI 識別 AI」的做法保持謹慎。一些自動檢測工具在特定條件下確實可能比未受訓練的人眼更可靠,但一旦輸入圖像和其訓練數據分佈差異過大,演算法就會出現失誤甚至系統性偏差。換言之,把甄別任務完全交給另外一個黑盒模型,並不是萬無一失的解決方案。
一篇相關研究還提出了一個耐人尋味的發現:確認一張照片「是真的」,可能比識別一張「假的」更難。這項研究指出,觀者審視圖像的時間越長而始終找不到破綻,那麼它是真實照片的概率就越高。從這個角度看,「沒有發現錯誤」本身,反而可以成為真實性的證據之一。
📬 免費訂閱 TechRitual 科技精選
每 3 日由 AI 精選 5 篇最重要香港科技新聞,直送你信箱




