技嘉科技支援AMD Instinct™ MI200 高效能伺服器

主流高效能運算 (HPC) 和 AI 平台晉升為百億億級運算超級電腦
Email Sales
持續加速的應用
即使是目前市面最多核心數的x86處理器 (CPU),AMD EPYC™ 7003有時仍需要加速器來協同處理HPC和資料密集型的工作負載。

資料中心正在發生哪些轉變?
搭配效能強大的平行運算加速器,架構設計需支援可擴充性以實現每秒百億億級的運算力。AMD ROCm™ 5.0 以及Instinct™ MI200系列加速器讓機架伺服器也能輕易達到百億億級超級電腦的運算表現。 

 技嘉科技一系列2U~4U的G系列伺服器支援新一代AMD Instinct™ MI200加速器;除了專為搭載MI250所設計的G262-ZO0以外,廣為消費者青睞的G242、G292以及G482伺服器也都通過了PCIe介面的MI210加速器產品相容性測試。技嘉款式眾多的高效能伺服器除了能提供大型運算叢集進行組建與升級擴充外;也能支援小規模佈署,例如使用單一系統來啟動HPC專案。
適用高效能平行運算佈署的應用
HPC 和 AI
HPC的運算、儲存和網路基礎設施也為AI奠定了基礎,從而提供精準可靠的模型。針對不同的HPC或AI工作負載,技嘉的G系列伺服器與AMD Instinct™ MI200加速器也支援了不同的精度運算,從而提高使用者效益。
雲端 HPC
地端HPC市場持續增長,而雲端架構的HPC叢集成長速度更快。用戶端正逐漸地將運算服務遷移到雲端架構來享受快速的運算資源分派並支付相應的成本。雲端HPC能讓使用者獲得最新最好的軟硬體技術與維護支援。
工程與科學運算
大數據分析與科學模擬是工程師和科學家的共同需求。伺服器虛擬化環境的高效能平行運算兼具低延遲和高頻寬優勢,有助於提高工程師和科學家的科學模擬和研究工作。
創新的 AMD Instinct™ 技術

為創新應用提供寬廣的大道
AMD整合了運算架構中最重要的元件,CPU以及加速器來推升運算效能的極限。憑藉業界首創多晶片GPU封裝設計及第三代Infinity Fabric™結構,AMD EPYC™處理器和AMD Instinct™ MI200加速器為HPC和AI提供高性能和高傳輸的使用環境。

  1. AMD Instinct™ MI200系列加速器是業界首款採用多晶片GPU封裝設計的加速器,可最大限度地提高資料傳輸量和電源使用效率來面對最嚴苛的HPC和AI工作負載。
  2. 基於最新的AMD CDNA™ 2架構,Instinct™ MI200創新的矩陣核心設計,對比上一代加速器,理論峰值的FP64性能可高達7.8倍,並提供目前業界最佳的每秒3.2TB記憶體傳輸頻寬。
  3. 第三代AMD Infinity Fabric™技術實現CPU到GPU的直接串連並擴展了快取記憶體的一致性,允許CPU以代碼方式快速地對應加速器運算結果。 AMD Instinct™ MI250加速器更內建了八個AMD Infinity Fabric™傳輸通道,先進的GPU P2P傳輸讓傳輸速度最高更可高達800GB/s。
  4. AMD Instinct MI250 加速器內建八個AMD Infinity Fabric™傳輸迴路,提供先進的 GPU卡與卡之間點對點I/O 傳輸,最高可達 800 GB/s 的總總理論頻寬。
  5. Frontier (https://www.olcf.ornl.gov/frontier/) 是全球首批提供百億億次級運算力的超級電腦之一,Frontier率先採用AMD Infinity架構的節點控制,展現了最佳化的CPU及GPU異質架構運算力。

無邊界生態系統
AMD ROCm™是一個因應偕同加速器運算的開放式軟體平台,能簡化研究人員利用AMD Instinct™加速器在HPC以及AI的研究工作準備。ROCm平台建立在開放可攜性的基礎上,支援跨品牌的加速器和架構,已被全球數個百億億級超級電腦所使用。

AMD ROCm™ 5.0
最新版本的AMD ROCm™ 5.0擴大了AMD產品的應用環境,讓AMD Instinct™ MI200加速器為熱門的HPC和AI應用程式提供動力,並在關鍵工作負載中提供領先性能

  1. AMD ROCm™ 5.0支援AMD Instinct™ MI200加速器並優化了編譯器以及執行元件,是最新版的開放式軟體平台。
  2. AMD ROCm™ 5.0最佳化的函示庫能解放MI200加速器的運算效能,讓搭載AMD Instinct™加速器的平台能啟動FP64矩陣核心技術以減少運算核心重複工作的延遲,同時支援單精度和雙精度運算需求。
  3. AMD ROCm™ 5.0支援多款機器學習領域常用的框架,包含TensorFlow、PyTorch和ONNX-RT7。
  4. AMD Infinity Hub提供了可隨時佈署的軟體容器和指南;讓研究人員、資料科學家和用戶能快速的查詢並安裝適用於AMD Instinct™加速器平台的容器以佈署HPC應用程式或機器學習框架。
  5. AMD Infinity Hub:提供於 HPC、AI 和機器學習架構的可應用與容器部署指南。
G262-ZO0 搭載 AMD EPYC™ CPU 和 AMD Instinct™ MI250 加速器
AMD Instinct™ MI200 加速器優勢
高效性能
基於AMD CDNA™ 2架構的AMD Instinct™ 加速器採用矩陣核心技術設計,能提供HPC和AI應用所需的高效能運算。MI250的峰值雙精度效能高達45.3 TFLOPs,而MI210也高達22.6 TFLOPS。
可擴展性
第三代AMD Infinity Fabric™技術擴展了快取記憶體的一致性,採用高頻寬記憶體作為快取不但提供了每秒3.2TB的資料吞吐量,也允許運算模組橫向擴展的彈性。
多連接點
封裝內Infinity Fabric™介面是AMD CDNA™ 2 系列的關鍵創新之一,MI210最多能支援三個鏈接,而MI250更支援高達六個鏈接,用於 GPU點對點及GPU 和CPU之間的高速通訊傳輸。
領導創新
AMD Instinct™ MI200加速器是業界首款採用多晶片GPU封裝設計的加速器,具有高效的運算力的資料吞吐量,因此Frontier超級電腦選用AMD Instinct™ MI250加速器來進行運算加速應用。
支援各種運算精度
AMD Instinct™ MI200加速器針對BF16、INT4、INT8、FP16、FP32和FP32 Matrix進行了最佳化,能滿足HPC或AI系統對於不同運算精度的要求。
AMD Instinct™ MI250 加速器
型號 MI250 OAM
運算元件 208 CU
串流處理器 13,312
峰值雙精度效能 90.5 TF
峰值單精度效能 45.3 TF
峰值半精度效能 362.1 TF
記憶體容量 128GB HBM2e
顯示記憶體速率 1.6GHz
記憶體頻寬 Up to 3.2 TB/sec
總線類型 PCIe Gen4
Infinity Fabric Links Up to 6
最高耗電量 560W TDP
AMD Instinct™ MI210 加速器
型號 MI210 PCIe
運算元件 104 CU
串流處理器 6,656
峰值雙精度效能 45.3 TF
峰值單精度效能 22.6 TF
峰值半精度效能 181.0 TF
記憶體容量 64GB HBM2e
顯示記憶體速率 1.6GHz
記憶體頻寬 Up to 1.6 TB/sec
總線類型 PCIe Gen4
Infinity Fabric Links Up to 3
最高耗電量 300W TDP
適用的技嘉伺服器
1/5
HPC/AI Server - AMD EPYC™ 7003 - 2U DP Instinct™ MI250 4-GPU | Application: 人工智慧平台 , 人工智慧訓練伺服器 , 人工智慧推論伺服器 & 高效能運算伺服器
2/5
HPC/AI Server - AMD EPYC™ 7002 - 2U DP 8 x PCIe Gen4 GPUs (Broadcom solution) | Application: 人工智慧平台 , 人工智慧訓練伺服器 , 人工智慧推論伺服器 , 視覺特效演算 & 高效能運算伺服器
3/5
HPC/AI Server - AMD EPYC™ 7003/7002 - 2U DP 8 x PCIe Gen4 GPUs | Application: 人工智慧平台 , 人工智慧訓練伺服器 , 人工智慧推論伺服器 , 視覺特效演算 & 高效能運算伺服器
4/5
5/5
HPC/AI Server - AMD EPYC™ 7003 - 2U UP 4 x PCIe Gen4 GPUs | Application: 人工智慧平台 , 人工智慧訓練伺服器 , 人工智慧推論伺服器 & 視覺特效演算
加速實現你的科技創新
業務洽詢