阿里巴巴推出 RynnBrain 人工智能系統,助力機器人理解現實世界

阿里巴巴(Alibaba)近日宣布推出一款名為 RynnBrain 的人工智能系統,旨在推動現實世界中的機器人技術。這個新模型的發佈顯示出阿里巴巴對機器人技術的重視,該領域目前已吸引到來自美國的巨頭如 NVIDIA 和 Google 的大量投資。阿里巴巴的 DAMO 學院發布了一段短片,展示了機器人如何識別水果並將其放入籃子中。雖然這項任務看似簡單,背後的智能卻並不容易。機器人需要實時識別物體、追蹤位置並計劃精確的動作。

RynnBrain 被定位為一種基礎性具身 AI 模型,這類模型包括機器人、自動駕駛車輛及其他直接與物理環境互動的機器。隨著中美競爭加劇,中國已將具身 AI 視為國家優先事項。RynnBrain 專注於解決現有機器人模型中的一個主要弱點:對空間和時間的記憶不足。傳統的具身 AI 系統經常忘記物體位置或錯誤解讀場景。阿里巴巴表示,RynnBrain 通過時空記憶技術解決了這兩個問題,使機器人能回憶物體的出現位置並預測其下一步的動作。

該系統還支持全局回顧,機器人可以在選擇下一步之前回顧過去的行動。這種方法幫助減少了在複雜任務中出錯的可能性。RynnBrain 的物理空間推理增加了另一層次的能力,透過結合文本邏輯和空間線索,這種混合方法使機器人在推理時能更好地反映現實環境。阿里巴巴在其 Qwen3-VL 視覺語言系統上訓練了該模型,並利用一種名為 RynnScale 的自定義架構進行優化。該公司表示,這一設置在不增加計算資源的情況下將訓練速度加倍。

此次發佈的重點包括阿里巴巴所稱的業界首個擁有 300 億參數的專家混合型具身 AI 模型。儘管其規模龐大,該系統在推斷過程中僅啟動 30 億參數。阿里巴巴聲稱,這種效率使得該模型能夠超越更大型的 720 億參數系統。較低的推斷需求轉化為更流暢的機器人運動和更快的決策速度,這些提升在現實部署中至關重要,因為電力和延遲限制常常影響性能。

性能測試顯示出強勁的結果。阿里巴巴報告稱,RynnBrain 在 16 個開源具身 AI 基準測試中創下新紀錄,這些測試測量了環境感知、空間推理和任務執行能力。該公司表示,RynnBrain 超越了競爭對手,如 Google 的 Gemini Robotics ER 1.5 和 NVIDIA 的 Cosmos Reason 2。除了 RynnBrain,DAMO 學院還發佈了七個完全開源的模型,包括基礎模型和為商業用途設計的微調版本。阿里巴巴表示,這些發佈旨在降低機器人開發者的研究門檻,開放接入有助於加速在製造、物流和服務機器人領域的採用。

DAMO 學院還介紹了一個新的評估框架 RynnBrain-Bench,該基準針對具身 AI 測試中的一個長期空白,專注於細緻的時空任務,而非靜態圖像識別。這一舉措使阿里巴巴更深入地參與到與美國科技領導者及初創企業的全球競爭中。隨著機器人技術逐步走出實驗室和模擬環境,像 RynnBrain 這樣的具身 AI 模型可能會決定機器人在物理世界中的運作方式。阿里巴巴希望在這場競賽中佔有一席之地。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。