AI 應用新訊

NVIDIA Rubin CPX GPU 為超大語境推論 (上下文推理) 打造

稍早有傳言稱 RTX 5090 將會有 128GB 記憶體,實際上並不是,而是用在 AI 應用上面的 Rubin CPX GPU。

NVIDIA_rubin_cpx_1.jpg


最近 NVIDIA 在 AI Infra Summit 上正式發表 Rubin CPX GPU,這是一款專門為百萬 Token 等級的 AI 應用設計的新世代晶片,目標是讓 AI 可以同時處理龐大的程式碼專案,甚至生成長時間的影片內容。

Rubin CPX 搭配全新的 Vera Rubin NVL144 CPX 平台,每個機櫃就能提供高達 8 exaflops 的 AI 算力,以及 100TB 高速記憶體,單位效能比上一代系統快上 7.5 倍。NVIDIA 表示,這樣的規模不只滿足研究需求,更能讓企業在投資 1 億美元後,可能創造 50 億美元的 Token 收益,商業化潛力驚人。

NVIDIA_rubin_cpx_2.jpg


NVIDIA 創辦人黃仁勳指出,Rubin CPX 是第一顆專為超大語境(上下文推理) AI 設計的 CUDA GPU,可以同時理解並推理數百萬 Token 的知識,讓 AI 助手不只是自動寫程式,而是能真正掌握、優化大型專案。

Rubin CPX 採用 Rubin 架構,單卡就能提供最高 30 petaflops 的推論效能,配備 128GB GDDR7 記憶體,還支援更快的注意力運算,能處理更長的語境內容,應用範圍從軟體開發、影片搜尋到高品質生成影片都有大幅提升。

多家新創公司已經在測試 Rubin CPX:
  • Cursor:計畫用它來加速 AI 程式碼編輯器,幫開發者更快寫出程式。
  • Runway:看好 Rubin CPX 在生成長影片、複雜視覺特效上的表現,能幫創作者提升速度與真實感。
  • Magic:希望透過百萬 Token 視野,讓 AI 能讀懂完整程式碼庫與文件,往更智慧的軟體工程自動化邁進。

Rubin CPX 也將完整支援 NVIDIA 的 AI 生態,包括 Dynamo 推論平台、Nemotron 多模態模型,以及 AI Enterprise 軟體套件。NVIDIA 表示,新晶片預計在 2026 年底正式上市。

NVIDIA_rubin_cpx_3.jpg