AI 應用新聞

NVIDIA 發表 Nemotron 3 Nano、Super、Ultra 開放模型

  • Nemotron 3 系列開放模型包含 Nano、Super 與 Ultra 三種規模大小,是開發代理型 AI 應用最高效、精準的開放模型系列。
  • Nemotron 3 Nano 的輸送量是 Nemotron 2 Nano 的 4 倍,並透過突破性的混合式混合專家架構,為大規模多代理系統提供最高的每秒詞元數。
  • Nemotron 利用先進的強化學習技術,並結合大規模、並行的多環境後訓練,實現出色的準確度。
  • NVIDIA 率先釋出一系列先進的開放模型、訓練資料集,以及強化學習環境與函式庫,用於打造高精度、高效率的專用 AI 代理。
NVIDIA 今日宣布推出 NVIDIA Nemotron 3 系列開放模型、資料與函式庫,驅動各產業透明、高效且專業的代理型人工智慧(AI)開發。

nvidia_nemotron3.jpg


Nemotron 3 模型提供 Nano、Super 與 Ultra 三種規模大小,採用突破性的混合式潛在(hybrid latent)混合專家(MoE)架構,協助開發者大規模建置與部署可靠的多代理系統。

隨著組織從單一模型聊天機器人,轉向協作式多代理 AI 系統,開發者面臨日益增加的挑戰,包括通訊開銷、情境漂移(context drift),以及高昂的推論成本。除此之外,開發者需要足夠的透明度才能信任將其複雜工作流程自動化的模型。Nemotron 3 能夠直接應對這些難題,提供客戶建置專用代理型 AI 所需的效能與開放性。

NVIDIA 創辦人暨執行長黃仁勳表示:「開放式創新是 AI 進步的基礎。透過 Nemotron,我們正把先進 AI 轉化為開放平台,為開發者提供打造大規模代理型系統所需的透明度與效率。」

NVIDIA Nemotron 也支援 NVIDIA 更廣泛的主權 AI 推動計畫,從歐洲南韓,已有多個組織採用開放、透明且高效的模型,得以依據自身資料、法規與價值觀建置 AI 系統。

埃森哲、益華電腦、CrowdStrike、Cursor、德勤、安永、Oracle Cloud Infrastructure、Palantir、Perplexity、ServiceNow、西門子、新思科技及 Zoom 等早期採用者,正整合 Nemotron 系列模型,以驅動製造、資安、軟體開發、媒體、通訊等產業的 AI 工作流程。

ServiceNow 董事長暨執行長 Bill McDermott 表示:「NVIDIA 與 ServiceNow 多年來持續在塑造 AI 的未來,而精彩的部分才正要開始。今天,我們正向前邁出重要的一步,助力各產業領導者加速推進其代理型 AI 策略。ServiceNow 的智慧工作流程自動化結合 NVIDIA Nemotron 3,將以無可比擬的效率、速度與準確度,持續定義標準。」

隨著多代理 AI 系統持續擴展,開發者越來越依賴專用模型來實現最先進的推理能力,同時利用更高效、可客製化的開放模型來降低成本。在單一工作流程中將任務於前沿級模型與 Nemotron 間進行路由分配,既可極大化代理智慧,同時達到最佳化詞元經濟(tokenomics)

Perplexity 執行長 Aravind Srinivas 表示:「Perplexity 的核心理念,是將準確的 AI 融入如 AI 助理等卓越工具之中,以進一步放大人類的好奇心。透過我們的代理路由器,我們可以將工作負載導向最佳的微調開放模型,例如 Nemotron 3 Ultra,或在任務需要其獨特能力時利用領先的專有模型,從而確保我們的 AI 助理能以卓越的速度、效率與規模運作。」

開放的Nemotron 3 模型也讓新創公司能夠更快打造並迭代 AI 代理,加速從原型到企業部署的創新進程。General Catalyst、Mayfield與Sierra Ventures等投資組合中的公司,正採用 Nemotron 3 建置支援人機協作的 AI 夥伴。

Mayfield 管理合夥人 Navin Chaddha 表示:「NVIDIA 的開放模型堆疊與 NVIDIA Inception 計畫為早期公司提供模型、工具,以及具成本效益的基礎設施,讓他們能實驗、實現差異化並快速擴展。Nemotron 3 讓創辦人能夠快速建置代理型 AI 應用與 AI 夥伴,並協助他們接入 NVIDIA 龐大的既有用戶群。」

Nemotron 3 以高效率與精準度重塑多代理 AI

Nemotron 3 系列混合專家模型包含三種規模大小:
  • Nemotron 3 Nano :一款擁有 300 億個參數的小型模型,於目標明確、高效的任務時啟用至多30 億個參數。
  • Nemotron 3 Super :一款高精度的推理模型,具備約 1,000 億個參數和每詞元(token)至多 100 億個活躍參數,適用於多代理應用。
  • Nemotron 3 Ultra :一款大型推理引擎,約有 5,000 億個參數和每詞元至多 500 億個活躍參數,適用於複雜的 AI 應用。
Nemotron 3 Nano 即日起開放使用,是目前最具運算成本效率的模型,針對軟體除錯、內容摘要、AI 助理工作流程與資訊檢索等任務,以低推論成本進行最佳化。該模型採用獨特的混合式混合專家架構,帶來更佳效率與可擴展性。

相較 Nemotron 2 Nano,這項設計可將詞元輸送量提升最高達 4 倍,並可將推理詞元的生成量降低最高達 60%,大幅降低推論成本。憑藉 100 萬詞元的情境窗口,Nemotron 3 Nano 能夠記住更多內容,使其更加精準,並能有效連接長流程、多步驟任務中的資訊。

獨立 AI 基準測試機構 Artificial Analysis 將此模型評為同等規模模型中最開放且最高效的模型之一,並具備領先的準確度表現。

Nemotron 3 Super 擅長處理需要多個代理協作,且以低延遲完成複雜任務的應用。Nemotron 3 Ultra 則是一款高階推理引擎,適用於需要深度研究與策略規劃的 AI 工作流程。

Nemotron 3 Super 與 Ultra 採用 NVIDIA Blackwell 架構上的超高效率 4 位元 NVFP4 訓練格式,顯著降低記憶體需求並加快訓練速度。這樣的效率使得更大型的模型得以在既有基礎設施上完成訓練,同時在準確度上不遜於更高精度的格式。

透過 Nemotron 3 系列模型,開發者可依工作負載選擇合適規模的開放模型,從數十個代理擴展到數百個代理,同時受益於更快、更準確的長期推理,從而處理複雜的工作流程。

用於 AI 代理客製化的全新開放工具與資料

NVIDIA 同步釋出訓練資料集與尖端強化學習函式庫,供開發者打造專業AI代理。

其包含 3 兆詞元的全新 Nemotron 預訓練後訓練強化學習資料集,提供豐富的推理、程式碼與多步驟工作流程範例,可用於建置功能強大、領域專業化的代理。Nemotron Agentic Safety Dataset 則提供真實世界遙測資料,協助團隊評估並強化複雜代理系統的安全性。

為加速開發,NVIDIA 發布 NeMo GymNeMo RL 開源函式庫,提供 Nemotron 模型所需的訓練環境與後訓練基礎,並推出用於驗證模型安全與效能的 NeMo Evaluator。所有工具與資料集現已於 GitHub 與 Hugging Face 上提供。

Nemotron 3 已可支援 LM Studio、llama.cpp、SGLangvLLM。此外,Prime Intellect 與 Unsloth 也正將 NeMo Gym 的即用型訓練環境直接整合至其工作流程,讓團隊能更快、更輕鬆取得強大的強化學習訓練能力。

開始使用 NVIDIA 開放模型

Nemotron 3 Nano 現已在 Hugging Face 上線,並透過 BasetenDeepinfraFireworksFriendliAIOpenRouterTogether AI 等推論服務供應商提供。

Nemotron 可於企業級 AI 與資料基礎設施平台使用,包括 Couchbase、DataRobot、H2O.ai、JFrog、Lambda 與 UiPath。針對公有雲客戶,Nemotron 3 Nano 將可於 AWS 的 Amazon Bedrock(無伺服器)上取得,並預計很快也將在 Google Cloud、Coreweave、Microsoft Foundry、Nebius、Nscale 與 Yotta 上獲得支援。

Nemotron 3 Nano 以 NVIDIA NIM™ 微服務形式提供,可支援在任何 NVIDIA 加速基礎設施上進行安全、可擴展的部署,以獲得最大化的隱私與控制能力。

Nemotron 3 Super 與 Ultra 則預計將於 2026 年上半年開放使用。