AI 應用 NVIDIA 展示次世代 Vera Rubin 超級晶片, 雙 GPU 架構明年量產

soothepain

full loading
已加入
9/17/03
訊息
22,253
互動分數
1,981
點數
113
網站
www.coolaler.com
NVIDIA 在華盛頓舉行的 GTC 2025 大會上,首次展示了代號 Vera Rubin 的次世代超級晶片(Superchip),這是公司下一階段 AI 平台的核心設計,預計將在 2026 年正式進入量產。

NVIDIA-Vera-Rubin-1.jpg


這次亮相的 Vera Rubin Superchip 採用全新主機板設計,整合了一顆 Vera CPU 與兩顆體積龐大的 Rubin GPU,同時搭載多達 32 組 LPDDR 系統記憶體插槽,並配合 GPU 上的 HBM4 高頻寬記憶體,以滿足 AI 運算與訓練的龐大資料需求。

NVIDIA 執行長黃仁勳表示,Rubin GPU 已回到實驗室進行測試,代表首批樣品已由台積電生產完成。每顆 Rubin GPU 具備 8 組 HBM4 介面與雙晶粒設計(reticle-sized die),而 Vera CPU 則內建 88 個自訂 Arm 核心與 176 執行緒,效能定位遠高於現行 Blackwell 架構。

NVIDIA-Vera-Rubin-2.jpg


黃仁勳指出,Rubin GPU 預計在 2026 年第三或第四季 進入量產階段,時間點大約與目前 Blackwell Ultra GB300 Superchip 平台全面推廣相近。


NVIDIA Vera Rubin NVL144 系統(2026 年下半年登場)​


首波 Rubin 系列產品將以 Vera Rubin NVL144 為主,內含兩顆 Rubin GPU(各為雙晶粒設計)與一顆 Vera CPU。
整體平台具備:
  • FP4 精度推論效能達 50 PFLOPS
  • 288GB HBM4 記憶體
  • 1.8TB/s NVLINK-C2C 互連頻寬
NVIDIA-Vera-Rubin-3.jpg


推論與訓練效能分別可達 3.6 Exaflops(FP4)1.2 Exaflops(FP8),相較 GB300 NVL72 提升約 3.3 倍。

記憶體頻寬達 13TB/s、快取總量 75TB,NVLINK 與 CX9 連線能力也翻倍提升,分別可達 260TB/s 與 28.8TB/s。



NVIDIA Rubin Ultra NVL576 系統(2027 年下半年登場)​


第二階段的 Rubin Ultra NVL576 則將於 2027 年推出,採用四晶粒 GPU 設計,HBM4e 記憶體總容量達 1TB,整體系統規模從 144 擴充至 576。

效能方面:
  • FP4 推論效能高達 100 PFLOPS
  • FP8 訓練效能達 5 Exaflops
  • 相較 GB300 平台提升 14 倍,HBM4 記憶體頻寬達 4.6PB/s,快取容量 365TB
  • NVLINK 與 CX9 的傳輸能力更分別達 1.5PB/s115.2TB/s
NVIDIA-Vera-Rubin-4.jpg



NVIDIA 表示,Rubin 與 Vera 架構的設計目的,是為了迎接下一波 AI 模型與資料中心需求,並進一步提升 GPU、CPU 與 NPU 之間的協同效能。隨著 Rubin 系列在 2026 年正式量產,NVIDIA 的超級晶片平台將再次拉開與競爭對手的距離。

NVIDIA-Vera-Rubin-5.jpg






來源