英偉達發佈多模態模型 Nemotron 3 Nano Omni 智能體效率升至競品 9 倍

Henderson
29/04/2026

英偉達在官網發佈了開源多模態模型「Nemotron 3 Nano Omni」。該公司表示，新模型能將多種功能整合至單一系統，讓智能體利用視頻、音頻、圖像及文字的高階推理能力，提供更快、更智能的回應。新聞稿指出：「這款一體化模型為企業及開發者提供了一條高效、精準的多模態 AI 智能體生產路徑，並具備全面的部署靈活性及控制力。」英偉達聲稱，Nemotron 3 Nano Omni 以領先的準確性及低成本，為開源多模態模型樹立了新的效能標竿，在複雜文風智能、視頻及音頻理解方面，榮登六大排行榜首位。

據新聞稿描述，該模型採用 30B-A3B 混合專家架構，將視覺及音頻編碼器融入其中，無需獨立感知模型，從而提升大規模推理效率。它不僅效率高，且擁有強大的多模態感知精確度，使 AI 系統的吞吐量是其他具相同互動性的開源全向模型的 9 倍。最終實現更低的成本及更好的可擴展性，同時不犧牲回應速度或品質。

模型規格一覽

規格項目	詳細描述
模型名稱	Nemotron 3 Nano Omni
架構類型	30B-A3B 混合專家架構
支援模態	視頻、音頻、圖像、文字
效能亮點	吞吐量為同類模型 9 倍；領先六大排行榜
部署特性	低成本、高準確性、全面靈活性

英偉達指出，已有一批公司採用該模型，H Company 首位執行官 Gautier Cloix 表示：「基於該模型，我們的智能體能快速解讀全高清螢幕錄像——這在以往是無法實現的。」Cloix 補充：「這不僅是速度的提升，更是智能體即時感知及與數位環境互動方式的根本性轉變。」在代理系統中，Nemotron 3 Nano Omni 可與專屬雲模型或其他英偉達 Nemotron 開放心模型，以及其他供應商的專屬模型協同工作，為代理工作流程的子代理提供支援。

聲明最後提到，Nemotron 3 系列模型（包括 Nano、Super 及 Ultra 型號）在過去一年中的下載量超過 5000 萬次。

Henderson

Henderson 是 TechRitual Hong Kong 科技編輯，專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來，累計撰寫數千篇科技報導及產品評測，內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。