中國新型人形機械人展示高難度動作技術

中國北京通用人工智能研究院(BIGAI)最近推出了一個新的類人機器人運動框架,名為 OmniXtreme,根據中國媒體 CGTN 的報導。這個 OmniXtreme 框架使類人機器人能夠執行一系列高難度的運動,包括後空翻、托馬斯風格以及武術踢擊。報導指出,該框架使類人機器人在現實部署中能夠以高成功率執行多種複雜動作。它允許單一算法控制多個運動,顯著提高了訓練具備高級身體技能的機器人的效率。

在實驗中,研究人員使用了一台 Unitree G1 類人機器人進行測試。該類人機器人演示了多種技能,包括霹靂舞和 B-boy 動作,最後以快速連續的後手翻作為高潮。它成功執行了五次連續的 Webster 翻轉、長時間的街舞舞步、交替的槍式深蹲、前滾翻、蝴蝶踢、側手翻等多種動作。儘管這些動作主要是舞蹈動作,該類人機器人也能執行俯臥撑及多個攻擊組合。

在機器人技術領域,實現高度協調和動態的行動一直是一大挑戰。強化學習通常用於教導機器人如何執行複雜的動作。然而,隨著複雜動作數量的增加,控制變得愈加困難。根據研究的共同作者之一黃思源在 X 平台上的發文,大多數高動態極限動作都是由過度擬合的追蹤策略執行的。到了目前為止,訓練一個能夠以高成功率執行多種極限動作的統一策略仍然是一個未解的挑戰。

OmniXtreme 策略框架的開發正是為了解決這一挑戰。與傳統的強化學習方法不同,OmniXtreme 采用了一個兩階段的學習框架作為通用策略。黃思源透露,透過這個策略,類人機器人能夠執行多樣的極限動作,包括連續的後空翻、極端平衡,甚至是快速接觸切換的霹靂舞。根據 BIGAI 的說法,該系統在多個高動態任務中達到了超過 90% 的成功率。

這一方法的第一階段是預訓練,主要通過基於 DAgger 的流匹配來訓練一個統一的基礎策略,以整合來自多個運動追蹤專家的多樣運動先驗。在第二階段的後訓練中,基礎策略被凍結,並在嚴格的馬達約束、廣泛的域隨機化和安全正則化下優化剩餘策略,以彌補模擬與現實之間的差距。研究人員還進行了消融研究,以測試系統中各部分的實際重要性。他們使用了如安全正則化和馬達特性建模等組件進行實驗,以比較動態動作的成功率、機器人穩定性、安全性和關節能量負載等指標。

整體方法有效應對了運動真實性和擴展性的挑戰。研究人員相信,這一成果將為未來世代的類人機器人運動提供基礎,並為訓練機器人掌握更複雜的技能奠定基礎。OmniXtreme 框架的研究論文已於 2 月 27 日在 arXiv 發佈。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。