AMD Instinct™ MI300系列

將百億億次級的技術導入主流高效能運算與人工智慧領域

百億億次運算時代的加速器

・Frontier是全球五百大超級電腦中持續強佔領首位的超級電腦,也是 Green500 榜上有名的節能超級電腦;能有此卓越表現歸因於採用AMD EPYC處理器和AMD Instinct系列加速器。即便使用技術領先的處理器,也需要平行運算加速器來進行高效能運算、人工智慧訓練和推理以及資料密集型工作負載。

・針對資料中心等級的AMD加速處理單元(APU)與獨立加速器模組,技嘉已為AMD Instinct™ MI300系列量身訂做氣冷與液冷式伺服器產品。AMD Instinct™ MI325X和MI300X 加速器專為AI訓練和推理而設計;採用安裝在通用機板(UBB)上的開放加速模組(OAM module)型態,裝載在技嘉的G系列伺服器中。AMD Instinct MI300A,採用LGA插槽設計,為整合CPU/GPU的加速處理單元(APU)聚焦於高效能運算和AI訓練工作負載應用;而技嘉的G383-R80伺服器即提供四組MI300A APU插槽。

・El Capitan預計將成為目前上最強大的超級計算機,能夠每秒執行超過2百億億次浮點運算。這台超級電腦的核心為AMD Instinct MI300A APU,專為克服CPU與GPU之間通道不足產生的效能瓶頸、額外的數據管理工作以及為GPU效能修改程式碼而設計。MI300A APU架構採用晶片組設計,AMD Zen4 CPU和AMD CDNA™3 GPU共享記憶體。這意味著該技術不僅能支持單一伺服器等小規模部署,還能擴展至大型計算叢集。人工智慧訓練和高效能運算的需求即在眼前,而技嘉擁有您所需的技術來加速這一進程。
獨立加速器模組與資料中心級的加速處理單元
AMD Instinct™ MI300 系列,包括 MI300X & MI325X 加速器模組及MI300A ,旨在以精實、高效率的形式提升人工智慧和高效能運算能力。

MI300A是針對單一伺服器插槽的加速處理單元(APU),透過在單組晶片上結合 GPU、CPU 和高頻寬記憶體(HBM3),有助於提高資料傳輸效率和運算密度。

AMD MI300X & MI325X在標準伺服器平台上為每個運算節點提供了強大的平行運算能力,每個節點可搭載8組OAM型態的加速器模組。

AMD Instinct MI300系列的問世,目的在於提高資料中心運算效率、解決預算和永續性等用戶所關注的議題,亦提供高度可程式化的GPU軟體平臺。AMD Instinct MI300系列採用新一代的GPU核心技術,適用於生成式人工智慧和高效能運算,以及高吞吐量的AMD CDNA 3 GPU計算單元,並具備本地稀疏矩陣支援。通過增強運算吞吐量、簡化程式設計和部署,AMD Instinct MI300系列克服了在高效能運算中心其資源、複雜性、速度和架構不斷增長的挑戰,並滿足對人工智慧和加速高效能運算的需求。AMD Instinct MI300 系列已準備就緒,隨時為客戶部署。

選擇搭載AMD Instinct™ MI300系列伺服器

  • speed_PERFORMANCE
    高效能運算

    搭載8組GPU模組基板的伺服器透過優化的散熱設計,確保處理器和GPU算力維持峰值效能。

  • expansion
    彈性擴展

    提供多組擴充槽,可彈性配置乙太網路或InfiniBand 網路介面卡,以實現節點之間高速資料傳輸。

  • green
    能源效率

    透過即時電源管理、自動風扇速度控制以及冗餘鈦金級電源供應器(PSU)確保最佳的散熱效果和能源效率。亦有DLC(液冷)方案供選擇。

  • More Floor Space
    高密度算力

    提供業界領先的高密度算力,5U機身的G593 系列及 3U機身的G383 系列,擁有高密度算力同時亦提供絕佳穩定性。

  • cooling
    先進散熱

    隨著導入直接液冷(DLC)技術,改善系統整體表現,處理器與GPU的熱設計功耗(TDP)持續增長也不構成問題,充分發揮尖端運算的最大潛能。

AMD Instinct™ MI300 系列規格

AMD Instinct™ MI325X & MI300X GPU
AMD Instinct™ MI300A APU
MI325X GPU MI300X GPU Model MI300A APU
OAM module Form Factor APU SH5 socket
- AMD ‘Zen 4’ CPU cores 24
304 GPU Compute Units 228
19,456 Stream Processors 14,592
163.4 TFLOPS Peak FP64/FP32 Matrix* 122.6 TFLOPS
81.7/163.4 TFLOPS Peak FP64/FP32 Vector* 61.3/122.6 TFLOPS
1307.4 TFLOPS Peak FP16/BF16* 980.6 TFLOPS
2614.9 TFLOPS Peak FP8* 1961.2 TFLOPS
256 GB HBM3E 192 GB HBM3 Dedicated Memory Size 128 GB HBM3
6.0 GHz 5.2 GHz Memory Clock 5.2 GHz
6 TB/s 5.3 TB/s Memory Bandwidth 5.3 TB/s
PCIe Gen5 x16 Bus Interface PCIe Gen5 x16
8 Infinity Fabric™ Links 8
1000W750W Maximum TDP/TBP 550W / 760W (Peak)
Up to 8 partitions Virtualization Support Up to 3 partitions

* Indicates not with sparsity

主打新品

1 / 3
1 / 2