AMD 最近推出了 Alveo V80 運算加速卡,這是專為具有大型資料集的記憶體受限型應用而設計,對於大規模資料處理,最佳效能不僅取決於原始運算能力,也取決於高記憶體頻寬。因此,全新AMD Alveo™ V80運算加速卡,這些應用需要FPGA硬體靈活應變能力以實現工作負載最佳化。Alveo V80加速卡現已量產出貨,相較前一代加速卡帶來至高2倍的頻寬與運算密度註1,並為使用AMD Vivado™設計套件的FPGA設計人員提供簡化的開發流程。
這款全新加速卡採用全高、3/4長(FH¾L)尺寸規格,由AMD Versal™ HBM自行調適系統單晶片(SoC)提供支援,具備2,600,000個LUT邏輯單元的FPGA架構、10,848個DSP運算邏輯片以及820 GB/s的記憶體頻寬,從而助力克服效能瓶頸。
相較前代產品AMD Alveo U55C運算加速卡,Alveo V80不僅帶來至高2倍的邏輯密度與記憶體頻寬提升,更有著至高4倍的網路頻寬註1,可以實現強大的運算叢集,同時最佳化多個卡、伺服器以及機架空間。
為大型資料集和記憶體密集型工作負載專屬打造的網路附接加速卡
Alveo V80加速卡的硬體靈活度讓橫跨多元的客製化工作負載進行廣泛應用。作為一款4x200G網路附接加速卡,其可即時處理大量傳入資料,避開GPU遇到的PCIe®連接限制。
Alveo V80加速卡可透過乙太網路擴展到數百個節點實現運算叢集,非常適合基因定序、分子動力學、感測器處理等一系列高效能運算(HPC)應用。在網路安全方面,內建400G加密引擎和600G乙太網路硬區塊,加之FPGA的硬體靈活度,令Alveo V80加速卡適用於線速(line-rate)封包偵測和AI支援的異常檢測。
該加速卡也非常適合運算儲存和資料分析,能夠在同一張卡上整合壓縮和查詢加速,從而增加有效儲存容量,同時更快獲得洞察。此外,其適合於各種金融科技應用,包括策略回溯測試、期權定價以及金融建模與模擬。
案例:天文物理學運算飛躍
聯邦科學和工業研究組織(Commonwealth Scientific and Industrial Research Organization,CSIRO)是澳洲的國立研究組織,其參與建造全球最大的無線電天文學天線陣列,該天線陣列目前具備420張Alveo U55C加速卡用於處理無線電波,以研究早期宇宙並探索銀河系演化。
CSIRO計畫透過Alveo V80加速卡縮減占板面積與成本,並將所需加速卡的數量精簡多達66%,同時應對來自望遠鏡131,000個天線的新訊號處理任務。考慮到卡、伺服器、機架空間與功耗的潛在減少,每卡算力的躍升預計可帶來至高20%總擁有成本(TCO)下降註2。
CSIRO太空與天文學部門研究工程師Grant Hampson表示,我們起初採用Alveo產品線是因為其能夠即時處理大量感測器資料。對於我們的新一代波束形成器和相關器來說,降低總擁有成本勢在必行。Alveo V80加速卡帶來相較上一代Alveo U55C卡的技術階躍(step-function)提升,以經濟高效的占板面積提供緊湊且節能的解決方案註2。
為FPGA設計人員簡化開發
Alveo V80加速卡經由Alveo Versal範例設計(AVED)完全可為傳統硬體開發人員使用,現已在GitHub上提供。AVED利用傳統FPGA和RTL流程簡化硬體啟動,並且基於常見的Vivado工具流程。範例設計採用在AMD Versal自行調適SoC上實現並專門為Alveo V80加速卡預先構建的子系統,提供高效的起點。
在系統層面,Alveo V80運算加速卡簡化系統整合並提供快速的量產路徑。透過使用預先驗證的部署卡,設計團隊可以避開PCB整合、庫存管理和產品生命週期管理任務。
現已出貨
Alveo V80已投入量產,現可透過AMD與授權經銷商購買。欲了解更多關於全新加速卡如何為基礎架構重新定義運算,請參閱此連結;欲了解更多關於詳細規格資訊,請參閱產品簡介和資料表,或聯繫專家。
註1:基於截至2024年4月公開發布的AMD Alveo產品選型指南中發布的規格。(ALV-13)。
註2:基於CSIRO在2023年10月進行的獨立「早期試用體驗」效能和成本分析估算,比較420張Alveo U55C加速卡的現有實施與140張AMD Alveo V80加速卡的預期實施。預計總擁有成本以三年期運算,包括電力和冷卻營運支出的預計成本。所有效能和成本節省聲明均為CSIRO提供的估算值,未經AMD驗證。效能和成本效益受各種假設和變數影響,且可能基於系統組態和其他因素而發生變化。結果僅針對CSIRO,可能不具典型性。有關更多詳細資訊,請參見圖3。(ALV-16)。
這款全新加速卡採用全高、3/4長(FH¾L)尺寸規格,由AMD Versal™ HBM自行調適系統單晶片(SoC)提供支援,具備2,600,000個LUT邏輯單元的FPGA架構、10,848個DSP運算邏輯片以及820 GB/s的記憶體頻寬,從而助力克服效能瓶頸。
相較前代產品AMD Alveo U55C運算加速卡,Alveo V80不僅帶來至高2倍的邏輯密度與記憶體頻寬提升,更有著至高4倍的網路頻寬註1,可以實現強大的運算叢集,同時最佳化多個卡、伺服器以及機架空間。
為大型資料集和記憶體密集型工作負載專屬打造的網路附接加速卡
Alveo V80加速卡的硬體靈活度讓橫跨多元的客製化工作負載進行廣泛應用。作為一款4x200G網路附接加速卡,其可即時處理大量傳入資料,避開GPU遇到的PCIe®連接限制。
Alveo V80加速卡可透過乙太網路擴展到數百個節點實現運算叢集,非常適合基因定序、分子動力學、感測器處理等一系列高效能運算(HPC)應用。在網路安全方面,內建400G加密引擎和600G乙太網路硬區塊,加之FPGA的硬體靈活度,令Alveo V80加速卡適用於線速(line-rate)封包偵測和AI支援的異常檢測。
該加速卡也非常適合運算儲存和資料分析,能夠在同一張卡上整合壓縮和查詢加速,從而增加有效儲存容量,同時更快獲得洞察。此外,其適合於各種金融科技應用,包括策略回溯測試、期權定價以及金融建模與模擬。
案例:天文物理學運算飛躍
聯邦科學和工業研究組織(Commonwealth Scientific and Industrial Research Organization,CSIRO)是澳洲的國立研究組織,其參與建造全球最大的無線電天文學天線陣列,該天線陣列目前具備420張Alveo U55C加速卡用於處理無線電波,以研究早期宇宙並探索銀河系演化。
CSIRO計畫透過Alveo V80加速卡縮減占板面積與成本,並將所需加速卡的數量精簡多達66%,同時應對來自望遠鏡131,000個天線的新訊號處理任務。考慮到卡、伺服器、機架空間與功耗的潛在減少,每卡算力的躍升預計可帶來至高20%總擁有成本(TCO)下降註2。
CSIRO太空與天文學部門研究工程師Grant Hampson表示,我們起初採用Alveo產品線是因為其能夠即時處理大量感測器資料。對於我們的新一代波束形成器和相關器來說,降低總擁有成本勢在必行。Alveo V80加速卡帶來相較上一代Alveo U55C卡的技術階躍(step-function)提升,以經濟高效的占板面積提供緊湊且節能的解決方案註2。
為FPGA設計人員簡化開發
Alveo V80加速卡經由Alveo Versal範例設計(AVED)完全可為傳統硬體開發人員使用,現已在GitHub上提供。AVED利用傳統FPGA和RTL流程簡化硬體啟動,並且基於常見的Vivado工具流程。範例設計採用在AMD Versal自行調適SoC上實現並專門為Alveo V80加速卡預先構建的子系統,提供高效的起點。
在系統層面,Alveo V80運算加速卡簡化系統整合並提供快速的量產路徑。透過使用預先驗證的部署卡,設計團隊可以避開PCB整合、庫存管理和產品生命週期管理任務。
現已出貨
Alveo V80已投入量產,現可透過AMD與授權經銷商購買。欲了解更多關於全新加速卡如何為基礎架構重新定義運算,請參閱此連結;欲了解更多關於詳細規格資訊,請參閱產品簡介和資料表,或聯繫專家。
註1:基於截至2024年4月公開發布的AMD Alveo產品選型指南中發布的規格。(ALV-13)。
註2:基於CSIRO在2023年10月進行的獨立「早期試用體驗」效能和成本分析估算,比較420張Alveo U55C加速卡的現有實施與140張AMD Alveo V80加速卡的預期實施。預計總擁有成本以三年期運算,包括電力和冷卻營運支出的預計成本。所有效能和成本節省聲明均為CSIRO提供的估算值,未經AMD驗證。效能和成本效益受各種假設和變數影響,且可能基於系統組態和其他因素而發生變化。結果僅針對CSIRO,可能不具典型性。有關更多詳細資訊,請參見圖3。(ALV-16)。