機器人初創公司 Rhoda AI 最近從隱秘狀態中浮出水面,推出了一種新型的機器人智能解決方案,旨在幫助機器在受控實驗室環境之外可靠運作。該公司同時宣布已完成 4.5 億美元(約 HK$ 35.1 億)的 A 輪融資,以擴展其技術並推進工業應用。這個名為 FutureVision 的系統,基於一種預測物理世界變化的模型架構,並將這些預測轉換為機器人的行動。
Rhoda 表示,該系統能夠持續觀察周圍環境,預測未來狀態並將其表現為視頻,然後根據這些預測採取行動,並每幾百毫秒重複這個過程。目前的工業機器人通常依賴預先編程的路徑,並在嚴格結構的環境中表現最佳。即使是新型的 AI 方法,如視覺-語言-行動模型,當環境條件發生變化時也往往表現不佳。Rhoda 透過在互聯網規模的視頻數據上訓練機器人模型,然後進行針對機器人特定的學習,來解決這一限制。
Rhoda 不僅依賴遠程操作示範來訓練機器人,而是使用數億條在線視頻對系統進行預訓練。該公司表示,這種方法使模型能夠在控制機器人之前學習運動模式、物理學和物理互動。隨後,系統會用較少的真實機器人數據進行微調,以便將視覺預測轉換為實際行動。Rhoda 表示,這種名為直接視頻行動模型的架構,使機器人在工作時能夠適應變化的條件。
與一次性生成計劃並在沒有反饋的情況下執行的開放式系統不同,Rhoda 的模型會根據其觀察到的環境不斷更新行動。該公司指出,這種閉環過程有助於機器人在環境變化時保持準確性,並且能減少所需的機器人訓練數據。Rhoda 認為,新任務通常只需少於十小時的遠程操作數據即可學習。
該公司表示,其技術已在生產環境中進行測試,這些環境中的機器人必須應對不斷變化的材料和工作流程。在一項高產量的製造評估中,Rhoda 報告指出,某機器人系統在不到兩分鐘的循環內完成了組件處理工作,而無需人類干預,超越了客戶的性能目標。
Rhoda 的聯合創始人兼首席執行官 Jagdeep Singh 表示:「我們相信,下一個機器人時代需要理解世界如何運行的模型,而不僅僅是它的外觀或如何用語言描述。通過學習互聯網規模的視頻並在閉環中運作,我們的系統設計用於適應現實世界的變化,而這是傳統方法難以實現的。」
投資者指出,這項技術有潛力將自動化擴展到過去歷史上難以實現的領域。在製造業,高變化的任務歷來不易實現自動化。風險投資公司 Leitmotif 的管理合夥人 Jens Wiese 表示:「真正的挑戰不是一次性解決,而是在現實生產條件下提供一致、可靠的產出。」
Rhoda 表示,這筆新融資將支持進一步的研究和工程工作、工業試點以及機器人團隊的擴展。該公司表示,FutureVision 最終將作為基礎模型,授權給打造機器人硬件和軟件平台的合作夥伴。




