大曉機器人推出全球首個全屋三維可交互世界模型 Kairos-HomeWorld

✏️ 原創內容| TechRitual 編輯部

大曉機器人於2026年6月5日聯合香港中文大學多媒體實驗室及深圳河套學院,正式發佈全球首個全屋三維可交互世界模型 Kairos-HomeWorld。此技術突破了現有室內場景生成的限製,實現了全屋生成及個體物體的全交互,為具身人工智能及機器人訓練提供了大規模且高保真的中國家庭場景。

全屋三維生成技術的創新

Kairos-HomeWorld 的技術架構由四個階段組成,分別是全局結構生成、局部細節填充、閉環校驗及交互增強。這一創新架構能夠從單句文本生成結構完整且物理合理的住宅三維場景,解決了傳統方法在全局一致性及物理錯誤方面的挑戰。

四階段生成架構的詳細介紹

  • 全局結構生成:基於 K-D 樹的平面圖結構化表示方法,將真實住宅平面圖轉化為可供大語言模型學習的分層文本結構。
  • 局部細節填充:採用「俯視圖全局初始化 + 第一人稱細節漫遊」的策略,解決了2D-3D提升過程中的幾何漂移問題。
  • 閉環校驗:通過微調視覺語言模型,檢測並修正物理違規情況。
  • 交互增強:實現全屋可操作物體的生成,生成的場景平均包含超過15個可操作物體。

全球最大的中國家庭專屬全屋3D數據集

大曉機器人還同步開源了全球最大的中國家庭專屬全屋3D數據集,該數據集包含30萬套中國真實住宅平面圖及5000個完整的仿真場景,為具身人工智能的國產化落地提供了核心數據支持。這一數據集不僅填補了國內缺乏高保真室內場景數據的空白,還完整還原了中國家庭的居住特徵。

數據集的特點

  • 包含30萬張經過結構化標註的真實住宅平面圖。
  • 涵蓋5000個帶家具的全屋仿真場景。
  • 支持物理仿真與交互操作的物體資產達5萬個。

Kairos-HomeWorld 的推出不僅提升了機器人在中國市場的訓練效率,還加速了具身人工智能的產業化進程。透過這些技術創新,大曉機器人將進一步推動家庭機器人的普及。

Henderson
Henderson

Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。