MIT 與 NVIDIA 合作開發加速機器人動作規劃的新算法

MIT 與 NVIDIA 的研究團隊開發了一種強大的新算法,顯著加快了機器人規劃動作的速度。這項技術利用圖形處理單元(GPU)的並行計算能力,使機器人能夠在幾秒內完成複雜的多步操作任務,而不是逐一分析可能的解決方案。

這一技術的發展使得工廠和倉庫中的機器人能夠更有效地處理和打包各種大小和形狀的物品,即使在狹小或繁忙的環境中,也能避免損壞或碰撞。

麻省理工學院的研究生、該研究論文的主要作者威廉·申(William Shen)表示:「這對於時間至關重要的工業環境來說非常有幫助,因為需要快速找到有效的解決方案。如果算法需要幾分鐘才能找到計劃,而不是幾秒鐘,那將會給企業帶來損失。」

為了加速機器人任務和運動規劃,研究人員開發了一種名為 cuTAMP 的新算法。該算法涉及生成高級任務計劃(即一系列動作)和相應的運動計劃,後者定義了具體的參數,如關節位置和夾具方向。

在打包物品時,機器人需要考慮多個因素,包括如何抓取物品、如何對齊以獲得最佳配合、如何防止碰撞以及如何遵循打包順序和其他約束。這些任務的複雜性產生了龐大的搜索空間。由於許多活動不會產生正面結果,傳統方法隨機選擇潛在解決方案並逐一測試的效率較低。

cuTAMP 利用 NVIDIA 的 CUDA 平台進行並行計算,模擬和優化數千個動作計劃。它結合了取樣和優化兩種強大的技術。cuTAMP 不再進行隨機取樣,而是專注於更有可能滿足任務約束的有前景的解決方案,這種針對性的取樣顯著提高了初始候選的質量。

隨後,通過並行優化過程,cuTAMP 評估每個候選解決方案如何避免碰撞並滿足運動和任務約束。該算法不斷更新和篩選候選方案,直到收斂到可行的高質量計劃,顯著減少了複雜機器人任務的規劃時間。

研究人員通過利用 GPU 的強大性能增強了 cuTAMP 的任務和運動規劃算法,這使系統能夠同時取樣和優化數百或數千個解決方案,顯著提高了性能。申表示:「使用 GPU,優化多個解決方案的成本與優化單個解決方案相同。」

在涉及類似俄羅斯方塊的打包模擬測試中,cuTAMP 在幾秒內識別出成功且無碰撞的計劃,而這些任務對於傳統的順序規劃器來說需要更長的時間。在實際的機器手臂上部署時,該算法始終能在 30 秒內產生結果。

根據研究人員的說法,cuTAMP 是機器人無關的,並已在麻省理工學院的機器手臂和 NVIDIA 的人形機器人上成功測試。cuTAMP 不需要訓練數據,與機器學習系統不同,這使其能夠在未經先前接觸的情況下解決全新的問題。

該算法具有高度的通用性,不僅限於打包,還可擴展到工具使用等任務,並能輕鬆整合新技能。展望未來,團隊計劃整合語言和視覺模型,使機器人能夠根據用戶的自然語音命令解釋和執行計劃,從而使人機協作更加直觀。

該團隊的研究詳細信息已在預印本研究共享平台 arXiv 上發佈。

日本電話卡推介 / 台灣電話卡推介
一㩒即做:香港網速測試 SpeedTest HK


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。