為了打造未來的自主機器,某些模型需要依賴其他模型。開發自駕車、能夠操控實體環境的機器人或自主建築設備的公司,通常需要收集成千上萬小時的視頻數據進行評估和訓練。現在,整理和編目這些視頻的工作需要人類來完成,他們必須逐一觀看;即使快進,也無法有效應對如此龐大的數據量。
Nomadic AI 是一家由 CEO Mustafa Bal 和 CTO Varun Krishnan 創立的初創企業,旨在解決客戶在數據管理上的問題,許多客戶的 95% 車隊數據都存放在檔案中。尋找邊緣案例的難度加大,因為這些最有價值的數據通常涉及少見事件,且可能使不熟悉的物理 AI 模型困惑。Nomadic 正在通過一個平台,將視頻轉化為結構化、可搜索的數據集,利用一系列視覺語言模型來解決這些問題。
這一平台能更好地監控車隊,同時為強化學習和更快速的迭代生成獨特數據集。該公司於周二宣布完成 840 萬美元的種子輪融資,估值為 5,000 萬美元。此次融資由 TQ Ventures 領投,還有 Pear VC 和 Jeff Dean 參與,這將幫助公司吸引更多客戶並持續完善其平台。Nomadic 上個月在 Nvidia GTC 的投資比賽中獲得首獎。
兩位創始人在哈佛大學計算機科學的本科階段相識,Bal 在接受 TechCrunch 訪問時表示,他們在 Lyft 和 Snowflake 等公司的工作中,不斷遇到相同的技術挑戰。“我們為人們提供對自己視頻的見解,無論是驅動自主車輛還是機器人,”他說,“這才能推動這些自主系統的建設者向前,而不是隨機數據。”
例如,想要微調自主車輛(AV)對於在警察指揮下可以闖紅燈的理解,或是辨別每次車輛經過特定類型橋樑的情況。Nomadic 的平台可以識別這些事件,既可用於合規目的,也能直接納入訓練流程中。目前,像 Zoox、三菱電機、Natix Network 和 Zendar 等客戶已經在使用這一平台來開發智能機器。
Zendar 的工程副總裁 Antonio Puglielli 認為,Nomadic 的工具使公司能比外包的方式更快擴展業務,其領域專業知識使其在競爭中脫穎而出。這類基於模型的自動標註工具已成為物理 AI 的關鍵工作流程。像 Scale、Kognic 和 Encord 等已建立的數據標註公司也在開發 AI 工具來進行這項工作,而 Nvidia 則發佈了一系列可以適應這一問題的開源模型 Alpamayo。
Varun 認為,他們公司的工具不僅僅是標註工具,而是一個“代理推理系統:用戶描述需求,它就能找到所需的內容”,利用多個模型理解正在發生的行動並進行上下文分析。Nomadic 的投資者期待這家初創企業專注於這一特定基礎設施會帶來成功。TQ Ventures 的合夥人 Schuster Tanger 指出:“這就像 Salesforce 不會自己建設雲端,Netflix 不會自己建設內容分發設施一樣。”
Tanger 表揚了 Nomadic 的人才,指出 Krishnan 是國際象棋大師,世界排名 1,549。Krishnan 同時表示,公司大約十幾名工程師都發表過科學論文。現在,他們正全力開發特定工具,例如能理解從攝像頭畫面中進行變換車道的物理學,或能為機器人的夾具在視頻中提供更精確位置的工具。
從 Nomadic 和其客戶的角度來看,下一個挑戰是為非視覺數據(如激光雷達傳感器讀數)開發類似的工具,或整合來自多種模式的傳感器數據。Bal 表示:“處理 TB 級的視頻,與數百個超過 1,000 億參數的模型進行對比,然後提取準確見解,確實是非常困難的。”




