顯示卡 AMD 推出 Instinct MI210 加速器

soothepain

full loading
已加入
9/17/03
訊息
18,858
互動分數
1,830
點數
113
網站
www.coolaler.com
AMD(NASDAQ: AMD)宣布AMD Instinct™產業體系持續擴大,包括華碩、戴爾科技集團、技嘉、HPE、聯想、美超微(Supermicro)等合作夥伴提供更廣泛的系統支援,並推出全新AMD Instinct™ MI210加速器以及具備強大功能的ROCm™ 5軟體。AMD Instinct與ROCm產業體系為廣大高效能運算(HPC)與人工智慧(AI)客群提供exascale等級技術,以滿足加速運算資料中心工作負載日益增長的需求,同時縮短洞察與創新的時間。

AMD資料中心GPU與加速處理全球副總裁Brad McCredie表示,憑藉較前一代加速器倍增的平台數量、在HPC與AI應用領域中獲得越來越多客戶採用、以及商業ISV支援關鍵工作負載,我們正持續擴大AMD Instinct MI200加速器與ROCm 5軟體的產業體系。隨著在Ml200系列中推出AMD Instinct Ml210加速器,不論是為大規模HPC與AI工作負載提供業界領先的加速處理,或是在商業領域運用exascale等級技術,客戶皆可依據工作負載選用最適合的加速器。

amd_mi210.jpg



芬蘭CSC(芬蘭IT科學中心)LUMI領先運算機構總監Pekka Manninen表示,基於AMD EPYC處理器與AMD Instinct Ml200加速器的Lumi超級電腦將為大規模模擬與建模、AI、深度學習等工作負載帶來跨越世代的效能,以解決最艱鉅的科研難題。我們透過AMD Instinct Ml210加速器體驗到Instinct Ml200系列產品的強大效能,讓我們的科學家可在Lumi全面部署後,著手為複雜艱鉅的研究專案做好準備。


開拓HPC與AI的未來

AMD Instinct Ml200系列加速器旨在推動針對exascale等級系統的探索,協助研究人員、科學家與工程師解決從氣候變化到疫苗研究等最迫切的挑戰。AMD Instinct MI210加速器專為在PCle®介面下需要卓越HPC與AI效能的客戶提供exascale等級技術。基於AMD CDNA™ 2架構的AMD Instinct MI210加速器延伸AMD在PCIe規格介面卡的雙精度(FP64)效能領先優勢註1。此外,AMD Instinct MI210加速器擁有基於AMD Matrix Core技術的各種混合精度運算能力,為加速深度學習訓練提供強大的解決方案。


推動各界採用ROCm

AMD ROCm開放軟體平台建構在眾多應用程式與函式庫的基礎之上,並為頂尖HPC與AI應用提供強大效能,讓研究人員、科學家、工程師發揮AMD Instinct加速器的強大效能,推動科學新發現。

AMD透過ROCm 5進一步擴大其軟體平台,新增對AMD Instinct Ml200系列加速器與AMD Radeon™ PRO W6800專業繪圖卡的硬體支援,再加上對Red Hat® Enterprise LinuX® 8.5作業系統的支援,協助開發者更容易運用ROCm平台,在各種關鍵工作負載中成就卓越效能。

此外,透過在AMD GPU上移植與優化的開源應用程式資源中心AMD Infinite Hub,可讓終端使用者輕鬆搜尋、下載並安裝各種容器化HPC應用與機器學習(ML)框架。AMD Infinity Hub應用容器旨在減少取得與安裝軟體的傳統難題,並讓使用者根據共享的經驗及問題解決辦法來獲得幫助。


不斷擴大的合作夥伴與客戶產業體系

隨著越來越多的專業應用對ROCm與AMD Instinct加速器進行優化,AMD進一步擴大其軟體產業體系,並新增了Ansys®、Cascade Technologies、以及TempoQuest等商業ISV合作夥伴。這些ISV合作夥伴可為計算流體力學(CFD)、氣象、電腦輔助工程(CAE)等加速工作負載提供應用程式。除了以上更新,ROCm現有的應用支援更涵蓋HPC、AI、ML應用、AMBER、Chroma、CP2K、GRID、 GROMACs、LAAMPS、MILC、Mini-HAAC、NAMD、NAMD 3.0、ONNX-RT、OpenMM、PyTorch、RELION、SPECFEM3D Cartesian、SPECFEM3D Globe、以及TensorFlow。

此外,AMD亦協助華碩、戴爾科技集團、技嘉、HPE、聯想、Supermicro等合作夥伴,以及Colfax、Exxact、KOI Computers、Nor-Tech、Penguin、Symmetric等系統整合商推出差異化解決方案,以應對新一代運算挑戰。眾多超級電腦客戶已開始充分利用這些新客戶成功案例所帶來的優勢,其中包括橡樹嶺國家實驗室的Frontier瑞典皇家理工學院(KTH)的Dardel芬蘭IT科學中心的LUMI、以及法國國家高等教育運算中心CINES的Adastra超級電腦


為客戶與合作夥伴提供優質服務

AMD Accelerator Cloud為客戶提供環境,得以從遠端存取與評估AMD Instinct加速器以及AMD ROCm軟體。不論是移植既有程式碼、測量應用效能、或測試多重GPU或多節點擴充的效能,AMD Accelerator Cloud都能協助潛在客戶與合作夥伴輕鬆快速取得最新的GPU與軟體資源。此外,AMD Accelerator Cloud也可應用在支援各種活動,例如為現有與潛在客戶提供黑客松(hackathon)和ROCm訓練課程,協助開發者提升技能並學習如何最大程度地發揮AMD Instinct加速器的效能。


MI200系列規格

型號​
運算單元​
串流
處理器​
FP64 | FP32 Vector (Peak)​
FP64 | FP32 Matrix (Peak)​
FP16 | bf16 (Peak)​
INT4 | INT8 (Peak)​
HBM2e ECC
記憶體​
記憶體
頻寬​
規格​
AMD Instinct MI210​
104​
6,656​
高達22.6 TF​
高達45.3 TF​
高達181.0 TF​
高達181.0 TOPS​
64GB​
高達
1.6 TB/秒​
PCle®​
AMD Instinct MI250​
208​
13,312​
高達45.3 TF​
高達90.5 TF​
高達362.1 TF​
高達362.1 TOPS​
128GB​
3.2 TB/秒​
OCP加速器模組(OAM)​
AMD Instinct MI250x​
220​
14,080​
高達47.9 TF​
高達95.7 TF​
高達383.0 TF​
高達383.0 TOPS​
128GB​
3.2 TB/秒​
OCP加速器模組(OAM)​


註1:AMD效能實驗室於2022年1月14日執行的測試,受測對象為AMD Instinct™ MI210(64GB HBM2e PCle®介面卡)加速器,在1,700 MHz峰值升頻引擎時脈下測得45.3 TFLOPS峰值理論雙精度(FP64矩陣);22.6 TFLOPS峰值理論雙精度(FP64);181.0 TFLOPS峰值理論 Bfloat16格式精度(BF16)浮點運算效能。
 

附件

  • amd_mi210_2.jpg
    amd_mi210_2.jpg
    66.2 KB · 人氣: 234
▌延伸閱讀