英偉達發佈多模態模型 Nemotron 3 Nano Omni 智能體效率升至競品 9 倍

英偉達在官網發佈了開源多模態模型「Nemotron 3 Nano Omni」。該公司表示,新模型能將多種功能整合至單一系統,讓智能體利用視頻、音頻、圖像及文字的高階推理能力,提供更快、更智能的回應。新聞稿指出:「這款一體化模型為企業及開發者提供了一條高效、精準的多模態 AI 智能體生產路徑,並具備全面的部署靈活性及控制力。」 英偉達聲稱,Nemotron 3 Nano Omni 以領先的準確性及低成本,為開源多模態模型樹立了新的效能標竿,在複雜文風智能、視頻及音頻理解方面,榮登六大排行榜首位。

據新聞稿描述,該模型採用 30B-A3B 混合專家架構,將視覺及音頻編碼器融入其中,無需獨立感知模型,從而提升大規模推理效率。它不僅效率高,且擁有強大的多模態感知精確度,使 AI 系統的吞吐量是其他具相同互動性的開源全向模型的 9 倍。最終實現更低的成本及更好的可擴展性,同時不犧牲回應速度或品質。

模型規格一覽

規格項目詳細描述
模型名稱Nemotron 3 Nano Omni
架構類型30B-A3B 混合專家架構
支援模態視頻、音頻、圖像、文字
效能亮點吞吐量為同類模型 9 倍;領先六大排行榜
部署特性低成本、高準確性、全面靈活性

英偉達指出,已有一批公司採用該模型,H Company 首位執行官 Gautier Cloix 表示:「基於該模型,我們的智能體能快速解讀全高清螢幕錄像——這在以往是無法實現的。」Cloix 補充:「這不僅是速度的提升,更是智能體即時感知及與數位環境互動方式的根本性轉變。」在代理系統中,Nemotron 3 Nano Omni 可與專屬雲模型或其他英偉達 Nemotron 開放心模型,以及其他供應商的專屬模型協同工作,為代理工作流程的子代理提供支援。

聲明最後提到,Nemotron 3 系列模型(包括 Nano、Super 及 Ultra 型號)在過去一年中的下載量超過 5000 萬次。

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。