機器人技術在未知地形中應用新方法

研究人員最近開發了一種新的控制系統,專為四足和人形機器人設計,使它們能夠在複雜地形中導航。這一系統採用了名為注意力基於地圖編碼的機器學習技術,並通過強化學習進行訓練。這一創新的系統不再需要一次性檢視整個地圖,而是讓機器人的控制模型聚焦於最重要的區域,以計劃其下一步的安全行動。這樣的網絡能夠識別並規劃在困難和多變的地形上可步行的安全位置,從而提高機器人的行動能力。

研究團隊成員之一的張沖(Chong Zhang)在接受《有趣工程》(Interesting Engineering)訪問時表示:“我們的工作中訓練了一個強化學習的行走控制器,它能夠讀取地形地圖並學會對最能預測安全未來步伐的區域進行自適應注意力的分配。”他補充說,這一系統不再均勻處理整個高維度地圖,而是通過注意力模塊給予每個區域不同的權重,這樣策略學習便能基於這種加權視圖進行規劃,過濾掉不相關的細節,從而提高在變化地形中的穩定性和泛化能力。

在真實的室內和室外環境中測試這些控制器的有效性,團隊使用了四足機器人ANYmal-D和人形機器人Fourier GR-1。值得注意的是,這些機器人成功地導航了在其訓練階段完全未見的環境,這顯示出系統的泛化能力和適應新挑戰的能力。此外,該方法還提供了獨特的視覺見解,通過可視化其地圖掃描,展示了神經網絡如何解釋其周圍環境。

儘管如此,張沖指出該系統的限制,因為目前僅在2.5D高度地圖的行走中進行過測試。他提到,系統無法考慮懸空的物體,例如樹枝或邊緣。他解釋說:“目前僅在2.5D高度地圖的行走中進行了驗證,因此無法對懸空的3D障礙進行推理。我們預計這一方法將擴展到完整的3D以及運動操控/全身控制,只需進行適度的架構變更,我們正在探索這一方向。”儘管如此,這項研究為未來的發展奠定了良好的基礎,未來機器人有可能應對更複雜的挑戰。

這一新控制系統在效率方面表現突出,能夠在低功耗的25W板載CPU上實時運行。與機器人馬達相比,計算機的功耗非常低,因為馬達是主要的能量消耗者。這一低功耗需求使系統變得實用且具有高度擴展性,幾乎可以整合到任何配備現代中央處理單元的機器人中。此外,這些新的控制器在性能上也優於其他最先進的行走控制器。張沖表示:“我們不僅讓機器人能夠應對多種不同的地形,還在訓練過程中通過獎勵高效步伐來降低功耗。在我們的硬件上,它能以每秒2米的速度穩定行走,這是在類似系統中見過的最快速度之一。”研究人員展望著注意力機制將擴展到更複雜的“運動操控任務”,例如開門、移動障礙物,甚至在手的協助下攀爬。這將為機器人開創許多可能性,從災難應對和探索到物流和個人助理,使其變得比以往更加多才多藝和強大。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。