Google 推出 Project Genie 原型,探索交互式虛擬環境的未來方向

Google 推出 Project Genie 原型,邁向交互式虛擬環境

Google 旗下的 AI 研究實驗室 DeepMind 於去年 8 月發佈了第三代 Genie 系統,展示了能夠實時生成交互式虛擬環境的 AI 技術。如今, Google 推出了實驗性原型,訂閱 Google AI 高級服務的用戶現已可搶先體驗。儘管尚不能即時生成 VR 世界,但這一目標已經近在咫尺。

Google 將 Project Genie 稱為「實驗性研究原型」,因此目前尚不是人們夢想中的那種「AI 遊戲機」。本質上,它允許用戶通過頁面界面創建、探索和修改交互式虛擬環境。

系統與先前的圖像和視頻生成器頗為相似,都需要輸入文本提示詞或上傳參考圖像,但 Project Genie 更進一步。

它設有兩個主要的提示輸入框,一個用於生成環境,另一個用於生成角色。第三個提示框則允許用戶在完整生成環境前調整初始外觀(例如:將劍變大、將樹木變為秋季形態)。 Google 指出,作為早期研究系統,Project Genie 存在諸多局限:生成的環境可能不符合真實世界的物理規律或提示要求;角色控制可能不穩定;每次體驗限時 60 秒;且先前宣布的特定功能尚未包含在內。

目前,用戶只能輸出體驗過程的視頻,不過可以探索並重新混編作品庫中已有的其他「世界」。

Project Genie 目前正面向美國境內年滿 18 歲的 Google AI Ultra 訂閱用戶逐步開放,未來計劃推廣至更廣泛的人群。

在 VR 頭顯實現類似 Project Genie 的功能,仍有重重障礙需要克服。最重要的挑戰之一無疑是雲串流。坦率地說,雲遊戲雖已登陸 VR 設備,但現階段體驗並不理想,因為延遲會因用戶與數據中心距離的遠近而有很大波動。另外,當前雲遊戲領域的主要平台(如 NVIDIA GeForce Now、Xbox 雲遊戲)大多針對平面屏幕遊戲設計;在渲染和輸入延遲方面,VR 頭顯的標準要嚴苛得多,通常要求動顯延遲不超過 20 毫秒,以避免用戶產生不適感。

這還沒考慮 Project Genie 需要以立體視覺方式渲染世界可能帶來的新問題:系統技術上需要生成兩個不同的視點,並融合成一個穩固的 3D 畫面。據悉,Project Genie 創建的世界模型具有概率性特徵,即物體的行為每次都可能略有不同,這同時是第三代系統每次只能支持最多幾分鐘持續交互的原因之一。系統的世界生成容易偏離初始提示,可能導致不如人意的結果。

儘管短期內不太可能見到其 VR 版本,但對於通往最終目標的這些蹣跚起步感到興奮。從學習的角度看,能夠像《星際迷航》中的全息甲板那樣,隨意召喚一個可探索的世界,這個想法本身就極具吸引力。

Google 地球 VR 對很多人來說已經是個常用應用,而更細緻、更生動的版本,將有助於學習外語、進行時間旅行和虛擬環球遊覽。

未來正在塑造成一個非常奇特的世界,並希望同時是有趣且不至於太糟糕的。我可以想象一個未來:逼真的、由 AI 驅動的環境與腦機接口技術緊密結合,最終呈現出真正期待的那種虛擬現實。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。