Boston Dynamics Spot 機械人用 Gemini AI 處理推理任務展示家居同工業應用

Boston Dynamics 為其四足機械人 Spot 搭載了 Google DeepMind 的 Gemini Robotics-ER 1.6 模型，目標是讓機械人從預設腳本行動轉向基於推理的任務執行。公司在一段影片中展示升級效果，Spot 能閱讀手寫待辦清單，並執行整理鞋子、拾取罐子及將衣物放入洗衣籃等動作。其中一段顯示機械人拿起牽繩並帶狗散步，突顯其將自然語言指令轉化為物理行動的能力。

系統整合視覺、語言理解及任務規劃，讓 Spot 能解讀周圍環境，並以最少人類輸入作出回應。這標誌著與傳統機械人不同的轉變，後者需精確程式設計。然而，示範亦暴露 AI 推理與現實執行的差距，例如機械人側向握住罐子，這類簡單錯誤可能導致灑出，顯示人類般理解仍有限。

工業巡檢帶來真正價值

儘管示範聚焦家居場景，此升級的主要目標仍是工業巡檢領域，Spot 已在大規模部署。公司設計 Spot 能在設施中巡航、辨識危險及監測人類難以或危險進入的環境。配備 Gemini Robotics-ER 1.6 後，Spot 可自主偵測積水、閱讀儀表並解讀現場狀況，亦能調用視覺-語言-行動模型以理解複雜環境。「Gemini Robotics-ER 1.6 等進展是機械人更好地理解及操作物理世界的重要一步，」Boston Dynamics Spot 副總裁兼總經理 Marco da Silva 表示

。「儀表閱讀及更可靠任務推理等能力，將讓 Spot 完全自主地察覺、理解及應對現實挑戰。」此更新建立在今年初 Boston Dynamics 與 Google DeepMind 的合作基礎上，專注將先進 AI 模型融入機械人系統。儘管系統提升可用性，挑戰依然存在。模型目前高度依賴視覺數據，欠缺人類透過觸摸及經驗獲得的深度物理理解。「機械人要可靠安全執行任務，機械人與人類理解世界的連結至關重要，」Google DeepMind 機械人部門主管 Carolina Parada 指出。

公司正透過基準測試改善安全及推理，指導機械人在現實情境下的行為。不過，完全自主仍需在多變環境中實現一致可靠性。Boston Dynamics 表示，實地部署將透過受控推出進行，客戶反饋將助系統精煉。公司強調，機械人須達高可靠性門檻，避免虛警並維持用戶信任。此發展突顯具身 AI 的進展與局限，即智能融入物理系統之際。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

Boston Dynamics Spot 機械人用 Gemini AI 處理推理任務展示家居同工業應用

工業巡檢帶來真正價值

Henderson

搜尋文章

工業巡檢帶來真正價值

相關文章

Henderson

搜尋文章