Instinct MI250/MI250X加速卡:内部集成了两颗核心

2021-11-10 09:38:33

来源:快科技

除了基于3D V-Cache堆叠缓存的升级版霄龙7003x系列处理器,AMD还为数据中心带来了另一款神奇:Instinct MI系列加速卡(加速器)。

这是AMD的第一款ExaScael百亿亿次级别加速卡产品,号称在同类产品中拥有世界上最快的HPC性能、AI性能。

Instinct MI200系列升级为新的CDNA2计算架构,搭配升级的6nm FinFET工艺,并使用2.5D EFB桥接技术,业内首创多Die整和封装(MCM),内部集成了两颗核心。

还有第三代Infinity Fabric总线互连技术,带宽100GB/s,最多8条与第三代霄龙处理器互通,实现CPU/GPU内存一致性。

软件API支持OpenMP、OpenCL、HIP、ROCm Open、TensorFlow、PyTorch、Kokkos、RAJA。

新系列分为两款型号,Instinct MI250X集成了220个计算单元、14080个流处理器核心,最高频率1.7GHz,并有第二代矩阵核心,峰值性能为:FP16半精度383TFlops、FP32单精度/FP64单精度47.9TFlops、FP32单精度/FP64双精度矩阵95.7TFlops、INT4/INT8/BF16 383TFlops。

内存/显存搭配8192-bit位宽的128GB HBM2e,频率1.6GHz,峰值带宽3276.8GB/s,并支持全芯片ECC。

整卡采用OAM模块形态(未来也 会推出PCIe扩展卡形态),支持PCIe 4.0 x16,被动散热(系统散热),典型功耗500W,峰值功耗560W。

Instinct MI250精简为208计算单元、13312流处理器核心,各项性能指标也顺应下降约5.5%,其他规格完全不变。

AMD宣称,Instinct MI200系列性能双精度性能比竞品高出最多4.9倍,比上代提升最多4倍。

MI200系列已经赢得了多项客户解决方案,包括ATOS BullSequana X410-A5 2U1N2S(双CPU四GPU)、戴尔PowerEdge R7525(双CPU三GPU)、技嘉G262-Z00(双CPU四GPU)、HPE Cray EX235a(单CPU四GPU)等等,其他客户还有话说、联想、KOI Cmputers等等。

尤其是与美国国防部橡树岭国家实验室、HPE合作打造的超级计算机“Frontier”,采用第三代霄龙处理器、MI250X加速卡,峰值算力高达150亿亿次浮点计算每秒。

关键词: 加速 MI250X MI250 Instinc