AMD不甘示弱,Zen4架构路线图公布,128核心力挽狂澜

西北忒别忒 2021-11-09 17:07:43

11月9日,AMD CEO苏姿丰在线上活动中公布了最新的Zen 4构架CPU的路线图,当中包括96核的Genoa和128核的Bergamo服务器CPU。

活动中发布了Instinct MI250X GPU和4款EPYC Milan-X处理器(最高配的EPYC 7773X是64核128线程,搭载高达768MB L3缓存。而最低的EPYC 7373X是16核32线程),

新路线图涵盖了第四代的EYPC服务器CPU,它们会使用台积电5nm,声称晶体管密度和能效比是现在EPYC 7nm工艺的2倍,性能提升25%(对消费端的Ryzen Zen 4也是好消息)。

新的96核Genoa(热那亚)是Zen 4架构,单核和多核性能都会有提升,支持DDR5内存、PCIe 5.0和CXL 1.1(Compute Express Link),为高性能计算(HPC)、通用型的数据中心、企业、云端服务器而设计,正在向客户进行抽样调查,将在2022年发布。

而128核的Bergamo(贝加莫)预计在2023年发布,它是为云端原生应用专门定制的高密度多线程架构,集成128个Zen 4c核心,这里的“c”代表为云端原生工作负载设计。也就是说,AMD Zen 4架构也会有2种核心,而Zen 4c明显就是“小核”。

Bergamo(贝加莫)也支持DDR5内存、PCIe 5.0、CXL 1.1、相同的RAS和全套Infinity Guard安全功能。其指令集、针脚都和Genoa(热那亚)兼容,意味着你可以把两代CPU放在同一台处理器里面。

新的Zen 4c核心,应该会比标准的Zen 4核心更小,去掉某些不需要的功能以提升计算密度。但它有专门为密度优化的缓存结构来增加核心数目,从而应对需要多线程性能的云端服务器负载。

新核心的独立缓存可能会更小,甚至可能会少一级缓存,但AMD没有透露更多的细节。

除了基于3D V-Cache堆叠缓存的升级版霄龙7003x系列处理器,AMD还为数据中心带来了另一款神器:Instinct MI200系列加速卡(加速器)。

这是AMD的第一款ExaScale百亿亿次级别加速卡产品,号称在同类产品中拥有世界上最快的HPC性能、AI性能。

Instinct MI200系列升级为新的CDNA2计算架构,搭配升级的6nm FinFET工艺,并使用2.5D EFB桥接技术,业内首创多Die整和封装(MCM),内部集成了两颗核心。

还有第三代Infinity Fabric总线互连技术,带宽100GB/s,最多8条与第三代霄龙处理器互通,实现CPU/GPU内存一致性。

软件API支持OpenMP、OpenCL、HIP、ROCm Open、TensorFlow、PyTorch、Kokkos、RAJA。

新系列分为两款型号,Instinct MI250X集成了220个计算单元、14080个流处理器核心,最高频率1.7GHz,并有第二代矩阵核心,峰值性能为:FP16半精度383TFlops、FP32单精度/FP64单精度47.9TFlops、FP32单精度/FP64双精度矩阵95.7TFlops、INT4/INT8/BF16 383TFlops。

内存/显存搭配8192-bit位宽的128GB HBM2e,频率1.6GHz,峰值带宽3276.8GB/s,并支持全芯片ECC。

整卡采用OAM模块形态(未来也会推出PCIe扩展卡形态),支持PCIe 4.0 x16,被动散热(系统散热),典型功耗500W,峰值功耗560W。

Instinct MI250精简为208计算单元、13312流处理器核心,各项性能指标也顺应下降约5.5%,其他规格完全不变。

AMD宣称,Instinct MI200系列性能双精度性能比竞品高出最多4.9倍,比上代提升最多4倍。

MI200系列已经赢得了多项客户解决方案,包括ATOS BullSequana X410-A5 2U1N2S(双CPU四GPU)、戴尔PowerEdge R7525(双CPU三GPU)、技嘉G262-Z00(双CPU四GPU)、HPE Cray EX235a(单CPU四GPU)等等,其他客户还有话说、联想、KOI Cmputers等等。

尤其是与美国国防部橡树岭国家实验室、HPE合作打造的超级计算机“Frontier”,采用第三代霄龙处理器、MI250X加速卡,峰值算力高达150亿亿次浮点计算每秒。

0 阅读:76

西北忒别忒

简介:电脑硬件发烧友,潮流装备黑科技