Helix 是驅動 Figure 人形機器人的人工智能大腦,最新的 Helix 02 系統已升級至最先進的全身控制系統。與早期限於上半身任務的型號不同,Helix 02 使用單一神經網絡來同時控制行走、操作與平衡,直接從原始傳感器數據中獲取信息。在一次關鍵的演示中,這款人形機器人能夠自主地在整個廚房中卸載和重新加載洗碗機,無需重置或人為干預。根據 Figure 的說法,這一系統取代了複雜的手動編碼控制,使用類似人類的運動學習,開創了新的靈活性層次。
2025 年 2 月,這家位於加州的公司首次發佈了 Helix,這是一種通用的視覺-語言-行動(VLA)模型,結合了感知、語言和控制來推進機器人技術。數十年來,運動操作(loco-manipulation)——即機器人能夠作為單一連續行為來移動和操作物體的能力——一直是機器人技術中最具挑戰性的問題之一。雖然行走與操作在孤立狀況下運作良好,但將它們結合起來則會引入不斷的耦合:抬起物體會影響平衡,行走步伐會改變可達性,手臂和腿部之間也會相互限制。
雖然人形機器人已經展示了一些令人印象深刻的短暫、預先編排的表演,如跳舞或跳躍,但大多數缺乏真正的適應能力。其運動往往是在離線計劃中進行的,並在現實條件變化時出現問題。傳統的機器人技術通過將運動和操作分開處理,並利用狀態機進行連接,解決了這一問題,這導致了緩慢、脆弱和不自然的行為。真正的自主性需要一種根本不同的方法——一個統一的系統,能夠同時感知、決策和行動。這正是 Helix 02 的動機,這是一個統一的全身運動操作 VLA 系統。
Helix 02 引入了系統 0,這是一個新的基礎層,添加到 Figure 現有的系統 1 和系統 2 階層中。系統 2 處理高層次推理和語言,系統 1 將感知轉化為高頻率的全身運動,而系統 0 以千赫茲速率執行類似人類的平衡和協調。據 Figure 表示,系統 0 在超過 1,000 小時的人類運動數據和大規模模擬上進行訓練,取代了手動工程控制,實現穩定、自然的運動。這三個系統的結合使得連續的、自適應的全身自主成為可能,讓人形機器人能夠實時行走、攜帶、伸展和恢復。
Figure 宣稱,Helix 02 在人形自主性方面邁出了重要的一步,能夠執行需要緊密整合行走、靈活性和感知的持續多分鐘任務。在完全自主的評估中,該系統無需遠程操作或重置即可完成擴展的行走和操作行為。一個標誌性的演示展示了 Helix 02 在四分鐘的全過程任務中,跨越一個完整的廚房加載和卸載洗碗機,這是迄今為止展示的最複雜的自主操作序列,也是人形機器人上首次實現的長時間“像素到全身”控制。
這項任務突顯了幾個能力:在保持精細抓取的同時行走,利用整個身體與環境互動,以及在複雜物體轉移和放置過程中協調雙臂。相同的神經網絡控制著從毫米級手指運動到房間級行走的動作,能夠在幾分鐘內連續執行超過 60 個動作並隱式恢復錯誤。Helix 02 也通過觸覺感知和掌上攝像頭推進了靈活操作。在自主測試中,機器人能夠擰開瓶蓋,從儲藥盒中提取單個藥丸,儘管存在遮擋,還能在可變阻力下精確分配注射器的容量,並從雜亂的容器中選擇小金屬零件。
根據這家機器人公司的說法,這些結果表明 Helix 02 如何結合全身控制、觸覺和手持視覺,以實現各種複雜的現實任務中的連續自適應自主性。這些結果雖然仍處於早期階段,但已顯示出連續的全身自主性所能帶來的可能性。這項四分鐘的自主任務中包含 61 個流暢執行的運動操作行為,觸覺感知和掌上攝像頭所實現的靈活行為,以及利用臀部和腳與手臂及手的全身協調。
