Boston Dynamics Spot 機械人用 Gemini AI 處理推理任務 展示家居同工業應用

Boston Dynamics 為其四足機械人 Spot 搭載了 Google DeepMind 的 Gemini Robotics-ER 1.6 模型,目標是讓機械人從預設腳本行動轉向基於推理的任務執行。公司在一段影片中展示升級效果,Spot 能閱讀手寫待辦清單,並執行整理鞋子、拾取罐子及將衣物放入洗衣籃等動作。其中一段顯示機械人拿起牽繩並帶狗散步,突顯其將自然語言指令轉化為物理行動的能力。

系統整合視覺、語言理解及任務規劃,讓 Spot 能解讀周圍環境,並以最少人類輸入作出回應。這標誌著與傳統機械人不同的轉變,後者需精確程式設計。然而,示範亦暴露 AI 推理與現實執行的差距,例如機械人側向握住罐子,這類簡單錯誤可能導致灑出,顯示人類般理解仍有限。

工業巡檢帶來真正價值

儘管示範聚焦家居場景,此升級的主要目標仍是工業巡檢領域,Spot 已在大規模部署。公司設計 Spot 能在設施中巡航、辨識危險及監測人類難以或危險進入的環境。配備 Gemini Robotics-ER 1.6 後,Spot 可自主偵測積水、閱讀儀表並解讀現場狀況,亦能調用視覺-語言-行動模型以理解複雜環境。「Gemini Robotics-ER 1.6 等進展是機械人更好地理解及操作物理世界的重要一步,」Boston Dynamics Spot 副總裁兼總經理 Marco da Silva 表示

。「儀表閱讀及更可靠任務推理等能力,將讓 Spot 完全自主地察覺、理解及應對現實挑戰。」此更新建立在今年初 Boston Dynamics 與 Google DeepMind 的合作基礎上,專注將先進 AI 模型融入機械人系統。 儘管系統提升可用性,挑戰依然存在。模型目前高度依賴視覺數據,欠缺人類透過觸摸及經驗獲得的深度物理理解。「機械人要可靠安全執行任務,機械人與人類理解世界的連結至關重要,」Google DeepMind 機械人部門主管 Carolina Parada 指出。

公司正透過基準測試改善安全及推理,指導機械人在現實情境下的行為。不過,完全自主仍需在多變環境中實現一致可靠性。Boston Dynamics 表示,實地部署將透過受控推出進行,客戶反饋將助系統精煉。公司強調,機械人須達高可靠性門檻,避免虛警並維持用戶信任。此發展突顯具身 AI 的進展與局限,即智能融入物理系統之際。

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。