英偉達在官網發佈了開源多模態模型「Nemotron 3 Nano Omni」。該公司表示,新模型能將多種功能整合至單一系統,讓智能體利用視頻、音頻、圖像及文字的高階推理能力,提供更快、更智能的回應。新聞稿指出:「這款一體化模型為企業及開發者提供了一條高效、精準的多模態 AI 智能體生產路徑,並具備全面的部署靈活性及控制力。」 英偉達聲稱,Nemotron 3 Nano Omni 以領先的準確性及低成本,為開源多模態模型樹立了新的效能標竿,在複雜文風智能、視頻及音頻理解方面,榮登六大排行榜首位。
據新聞稿描述,該模型採用 30B-A3B 混合專家架構,將視覺及音頻編碼器融入其中,無需獨立感知模型,從而提升大規模推理效率。它不僅效率高,且擁有強大的多模態感知精確度,使 AI 系統的吞吐量是其他具相同互動性的開源全向模型的 9 倍。最終實現更低的成本及更好的可擴展性,同時不犧牲回應速度或品質。
模型規格一覽
| 規格項目 | 詳細描述 |
|---|---|
| 模型名稱 | Nemotron 3 Nano Omni |
| 架構類型 | 30B-A3B 混合專家架構 |
| 支援模態 | 視頻、音頻、圖像、文字 |
| 效能亮點 | 吞吐量為同類模型 9 倍;領先六大排行榜 |
| 部署特性 | 低成本、高準確性、全面靈活性 |
英偉達指出,已有一批公司採用該模型,H Company 首位執行官 Gautier Cloix 表示:「基於該模型,我們的智能體能快速解讀全高清螢幕錄像——這在以往是無法實現的。」Cloix 補充:「這不僅是速度的提升,更是智能體即時感知及與數位環境互動方式的根本性轉變。」在代理系統中,Nemotron 3 Nano Omni 可與專屬雲模型或其他英偉達 Nemotron 開放心模型,以及其他供應商的專屬模型協同工作,為代理工作流程的子代理提供支援。
聲明最後提到,Nemotron 3 系列模型(包括 Nano、Super 及 Ultra 型號)在過去一年中的下載量超過 5000 萬次。
AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們。




