科學期刊研究指物理規律有助識別 AI 生成圖像

現代 AI 圖像生成器正迅速進化，早期的明顯破綻——例如畸形的手腳、亂七八糟的文字、怪異的畫面噪點——正逐漸被工程手段抹平。現今，許多合成圖片已足以騙過普通人的肉眼，在社交媒體上不加控制地傳播。然而，發表在《科學》（Science）期刊上的一項研究指出，這些模型在本質上依然「不了解」現實世界中光線和幾何的運行方式，物理規律正成為識別真偽圖像最可靠的工具之一。

研究者指出，只要測量反射、陰影、透視線等看似細枝末節的部分，就仍有機會拆穿一張看似完美的 AI 照片。這種基於物理世界一致性的核查方法，被數字取證專家視為在「深度偽造」時代區分真實照片與 AI 偽造的重要防線。早期的鑑別往往依賴肉眼捕捉粗糙的技術瑕疵，但隨著生成質量提升，圖像開始越來越符合人類對「真實」的主觀期待——色彩鮮明、構圖戲劇化、充滿電影感，這種「被製造出的戲劇性」反而讓人更容易放鬆警惕。

加州大學伯克利分校教授、被廣泛視為數字取證領域奠基人之一的 Hany Farid，一直在利用 AI 圖像的另一種「隱性弱點」。他的方法不是去尋找明顯的視覺錯誤，而是把生成圖跟現實世界中應當出現的幾何關係進行逐一對照。在他看來，現有的圖像生成模型尚未真正學會美術課上的基礎概念——消失點。

基於幾何與光線的驗真方法

以一張 AI 生成的「士兵在長廊中行進」的圖片為例，圖中可以看到一些顯而易見的缺陷，比如牆上模糊難辨的文字、莫名其妙的鏈條等。但更關鍵的線索藏在地面的瓷磚裡：按照透視原理，現實中的平行線（例如地磚縫、木地板接縫）在畫面中應當延伸並匯聚到同一個消失點。如果用直線工具沿著這些結構畫線，就可以檢查它們是否像真實照片那樣在遠方交匯，從而初步判斷圖像是否可信。類似的幾何關係同樣適用於反射。

研究指出，儘管今天的生成模型已能合成足以蒙混人眼的水面或鏡面反射，只要拿直尺量一量，問題就會暴露出來。在真實世界中，物體某一點與其在反射中的對應點之間連線，應當彼此平行，並在延長後指向一致的消失點；一旦這些線條出現不該有的偏差，就很可能意味著這是一張合成圖。陽光投下的陰影也為這種測試提供了額外抓手。由於太陽距離地球極其遙遠，可以近似認為照射到地面的陽光是平行光線。

在這種前提下，物體某個點與其陰影中對應點之間的連線，同樣應該能夠延長並匯聚於一個消失點。如果一張照片中，不同物體的陰影線無法指向一致的幾何關係，則很可能違背了光學基本規律。目前還很難預測生成式模型何時、以及能否在根本上克服這些物理層面的錯誤。相比早期那些肉眼易辨的瑕疵，基於透視和光線的「幾何驗真」要求觀察者花費更多時間和精力，遠超一般社交媒體用戶的日常警惕閾值。

一些研究者甚至認為，對這種物理規則的深刻掌握，可能已超出當前主流生成模型的設計能力範圍。在這項工作之外，專家也提醒用戶對「用 AI 識別 AI」的做法保持謹慎。一些自動檢測工具在特定條件下確實可能比未受訓練的人眼更可靠，但一旦輸入圖像和其訓練數據分佈差異過大，演算法就會出現失誤甚至系統性偏差。換言之，把甄別任務完全交給另外一個黑盒模型，並不是萬無一失的解決方案。

一篇相關研究還提出了一個耐人尋味的發現：確認一張照片「是真的」，可能比識別一張「假的」更難。這項研究指出，觀者審視圖像的時間越長而始終找不到破綻，那麼它是真實照片的概率就越高。從這個角度看，「沒有發現錯誤」本身，反而可以成為真實性的證據之一。

科學期刊研究指物理規律有助識別 AI 生成圖像

基於幾何與光線的驗真方法

Henderson

搜尋文章

基於幾何與光線的驗真方法

相關文章

Henderson

搜尋文章