基於自監督學習的潛在空間動力學模擬框架
蘇黎世聯邦理工學院與 Meta Reality Labs 合作開發了一種新的潛在空間動力學模擬框架,該框架基於自監督學習技術,能以極低的計算成本實現彈性物體的即時物理模擬。此技術在保持高保真動態效果的同時,將計算效率提升了三個數量級,為虛擬現實等計算資源受限的場景提供了可行的解決方案。 物理模擬是構建逼真虛擬環境的核心技術,尤其在對彈性物體如頭髮、布料、軟體等的動態建模中至關重要。傳統基於有限元的模擬方法雖然能夠生成高質量的物理動畫,但其計算複雜度極高,往往需要在每個時間步驟中解決包含數千甚至數萬個自由度的非線性系統。即使是最先進的優化算法,也難以在普通 CPU 上實現即時運行。 子空間模擬方法通過將系統投影到低基上來減少計算負擔,提供了速度與通用性之間的有效折衷。然而,大多數現有方法在時間步進過程中仍需頻繁評估全空間能量及其導數,這種全空間評估需要大量的計算資源,阻礙了它們在計算能力有限的設備上的部署。即使採用子空間模擬方法,實現真正的即時性能仍然是個難以達成的目標。 針對上述問題,研究團隊提出了一種全新的兩階段框架,將動態模擬完全置於低潛在空間中執行,徹底擺脫了對全空間計算的依賴。在第一階段,團隊利用深度自動編碼器將高頂點位置數據壓縮到低潛在空間。
編碼器網路將每一幀的頂點位置射為緊湊的潛在向量,而解碼器網路則負責將這些潛在向量重建回全空間。為了提高重建質量並抑制高頻伪影,研究團隊採用了特殊的技術手段。 在第二階段,團隊訓練了一個輕量級多層感知機作為潛在空間積分器。該神經網路以前兩個時間步的潛在狀態(zt-1,zt-2)以及當前和前兩個時間步的邊界條件作為輸入,直接預測下一幀的潛在向量 zt。該積分器採用了一種創新的自監督學習策略,其損失函數基於全空間物理能量的變分隱式歐拉損失。 具體而言,損失函數包含四個關鍵組成部分:基於連續三個位置計算的慣性能量、外部力產生的能量、強制執行邊界條件的二次懲罰勢能,以及物體固有的彈性勢能。
這個損失函數與離線全空間仿真中最小化的目標函數完全一致,但優化變量從位置變量轉變為神經網路權重和偏置參數。 為確保在自回歸推理中的長期穩定性,團隊提出了兩項關鍵的訓練策略:訓練噪點注入技術和數據平衡歸一化策略。通過這些策略,研究團隊能有效防止高能狀態主導優化過程,確保在不同能量狀態下都能獲得準確的結果。 研究團隊在多個具有挑戰性的例子上評估了該方法,實驗結果顯示該方法在 CPU 上的推理速度比傳統全空間模擬快 1,000 倍以上,且在不同實驗中均保持穩定的性能。雖然目前尚不支持可變幀率測試,但該方法的成功為未來在便攜設備上實現逼真物理效果開辟了新的技術途徑,未來的工作將探索更多的研究方向以進一步提升性能。




