盛数科技(ShengShu Technology)推出 Motubrain,這款統一式 AI 模型旨在成為機器人的通用大腦,將感知、推理、預測與動作整合於單一系統。公司表示,此模型取代傳統機器人依賴的碎片化任務專屬架構,改以單一框架處理多項任務及多種環境,從而減少對感測、規劃及執行獨立模組的依賴。Motubrain 在基準測試中表現出色,在 WorldArena 取得 63.
77 分,在 RoboTwin 2.0 的 50 項任務平均達 96.0 分,並據報為唯一在隨機環境中超過 95.0 分的模型。此系統建基於盛数科技先前透過 Vidu 平臺的生成式影片工作,利用大規模影片數據訓練機器人理解及互動真實世界環境。
一腦多任務
Motubrain 設計為統一多模態模型,同時從影片、語言及動作學習,讓機器人即時處理周遭環境、預測結果並採取行動,而無需在不同系統間切換。「真正的世界模型必須能建立真實世界的統一表徵,並預測其演變」,盛数科技創辦人朱軍表示。模型採用三流混合 Transformer 架構,整合不同模態輸入,讓機器人理解指令、預測環境變化,並在單一連續迴圈中產生適當動作。相異於傳統依賴標註數據集的系統,Motubrain 使用無標註影片、模擬數據及多機器人任務記錄進行訓練。
隱式動作框架直接從這些輸入提取運動模式,減少人工標註需求,提升擴展效率。在內部評估中,隨著任務複雜度及訓練數據增加,Motubrain 維持高於競爭系統的成功率。 Motubrain 可執行涉及最多 10 項原子動作的多步驟任務,遠超多數現有機器人系統的 2–3 項,讓機器人在單一序列中完成更複雜的真實活動。公司強調,通用世界模型不應拼湊模組,而應統一感知、推理、預測、生成及動作。
在真實測試中,使用 Motubrain 訓練的機器人展現執行中適應能力,例如拾取物件失敗時,能辨識並重試,無需預先針對該情境訓練。盛数科技表示,此模型已應用於機器人企業的工業、商業及家居環境訓練計劃中,與 Astribot、SimpleAI 及 Anyverse Dynamics 等公司合作擴大部署。由阿里巴巴雲領投的 2.93 億美元 B 輪融資(約 HK$22.
85 億)支持下,盛数科技定位 Motubrain 為邁向通用具身 AI 系統的關鍵一步,能在多樣真實環境運作。




