Meta 發佈了 V-JEPA 2,一款先進的 AI 模型,旨在幫助機器理解和預測現實世界中的物理互動。
V-JEPA 2 完全基於視頻數據進行訓練,改善了機器人和 AI 代理處理因果邏輯的能力,使其能夠在行動之前進行思考。
該公司認為,這是邁向建立人工通用智能的重要一步,這一方向被廣泛認為對於發展真正具思考能力的 AI 系統至關重要。
與以往系統不同,V-JEPA 2 在不依賴大量標記內容的情況下模擬物理現實。
它在簡化的“潛在”空間中運行,使其速度更快且更具適應性。Meta 相信這一創新可能改變機器人和自主機器在環境中導航和反應的方式。
除了模型之外,Meta 還發佈了三個新的基準,以支持研究人員評估 AI 如何從視頻中推理和學習。
V-JEPA 2 從視頻中學習,而非標籤
V-JEPA 2 使用展示人類和物體在現實世界中互動的視頻片段進行訓練。這使模型能夠學習重力、運動和障礙物的運作,例如理解球會從桌子上掉下來或隱藏的物體仍然存在。
Meta 在官方公告中表示:“V-JEPA 2 代表了我們在開發先進機器智能(AMI)方面的重要進展。”
與傳統 AI 模型需要大量註釋不同,V-JEPA 2 從原始視頻中提取模式。這使其能夠在不同上下文中進行概括,並更輕鬆地處理新情況。
機器人領域的實際應用
Meta 已經在實驗室機器人上測試了該模型。這些機器使用 V-JEPA 2 拿起不熟悉的物體、尋找目標並將物品放置在新位置。這標誌著機器人能夠在不可預測的環境中運作的一步。
該公司看到 V-JEPA 2 在自主機器(如送貨機器人和自駕車)方面的巨大潛力。這些系統需要快速解釋物理環境,以避免障礙並做出即時決策。
有了像 V-JEPA 2 這樣的世界模型,機器可以開始預測其行動的結果,與人類的思考方式相似。
世界模型的增長勢頭
Meta 與其他科技領袖共同推進世界模型的發展。Google 的 DeepMind 正在開發自己的版本 Genie,該模型可以模擬整個 3D 環境。
同時,Fei-Fei Li 的創業公司 World Labs 獲得了 2.3 億美元的資金,以建立更好理解物理空間的大型世界模型。
根據 CNBC 的報導,Meta 計劃向 Scale AI 投資 140 億美元,並引入 CEO Alexandr Wang 來加強其 AI 路線圖。
這項投資反映了該公司對超越文本的機器智能日益增強的關注。
支持研究生態系統
為了促進全球研究,Meta 在發佈 V-JEPA 2 的同時,還推出了三個基於視頻的基準。這些工具旨在衡量 AI 模型在現實場景中的理解、預測和計劃能力。
通過公開模型和基準,Meta 希望能促進 AI 研究社區的更快進展。
儘管語言模型仍然主導公共討論,V-JEPA 2 標誌著向物理世界智能的轉變,成為 AI 的下一個前沿。
日本電話卡推介 / 台灣電話卡推介
一㩒即做:香港網速測試 SpeedTest HK




