rubin cpx

  1. soothepain

    AI 應用 NVIDIA Rubin CPX GPU 為超大語境推論 (上下文推理) 打造

    稍早有傳言稱 RTX 5090 將會有 128GB 記憶體,實際上並不是,而是用在 AI 應用上面的 Rubin CPX GPU。 最近 NVIDIA 在 AI Infra Summit 上正式發表 Rubin CPX GPU,這是一款專門為百萬 Token 等級的 AI 應用設計的新世代晶片,目標是讓 AI 可以同時處理龐大的程式碼專案,甚至生成長時間的影片內容。 Rubin CPX 搭配全新的 Vera Rubin NVL144 CPX 平台,每個機櫃就能提供高達 8 exaflops 的 AI 算力,以及 100TB 高速記憶體,單位效能比上一代系統快上 7.5...