从EPYC 7002“Rome”处理器问世以来已经有一年半了。很难想象在这么长时间里,基于Zen 2处理器的服务器性能表现被广泛认可。EPYC 7002系列在很大程度上胜过Intel的Xeon可扩展处理器,目前,AMD通过推出EPYC 7003“ Milan”处理器来扩大其领先优势。最近几周,很多服务器厂商开始在Linux下对AMD EPYC Milan处理器进行测试,今天将初步分享性能数据以及下一代服务器/HPC处理器相关知识。
相比Zen 2服务器内核,Zen 3具有更高的整数吞吐量,使INT8能力加倍,减少了系统内存的有效等待时间并改善了分支预测,因此AMD EPYC 7003提供比EPYC 7002系列更高的性能。
EPYC 7003处理器继续使用SP3插槽,SKU最多支持64核/128线程,所有SKU均支持8通道DDR4-3200内存,SMT,安全加密虚拟化,并保留了Rome 引入的128个PCI Express Gen4通道。EPYC 7003系列的新增功能提供了32MB的L3高速缓存,Infinity Fabric时钟和DDR4-3200 DRAM,以及其他体系结构上的改进。
当前高端SKU 处理器EPYC 7763,64个内核,基本频率为2.45GHz,升压频率为3.50GHz,而TDP为280瓦。接下来是64核SKU的EPYC 7713 / 7713P,TDP为225瓦,2.0GHz基本频率和3.675GHz升频。
去年AMD推出7Fx2频率优化的Rome SKU,但在Milan发布的产品做了新的频率优化,以及对AMD 7xF3处理器的支持。新频率优化部件包括8核/ 6线程的EPYC 72F3(3.7GHz基本频率和4.10GHz升频)等。
EPYC 7003系列新增28核和56核的SKU,推测是想提供与Intel当前峰值核/线程数一致的型号,同时仍提供8/16/24/32/48/64核选项。相比Intel Xeon SKU列表,AMD EPYC产品阵容更加清晰明了。
AMD亮相的Milan处理器预计可通过零售渠道获得。AMD EPYC 7003系列订价(千片)范围从低端的EPYC 7313P(16核/ 32线程)的913美元起,到旗舰级的EPYC 7713(7060美元)和EPYC 7763(7890美元)。频率优化的SKU处理器从价格为2468美元的EPYC 72F3到价格为4860美元的75F3。Microsoft Azure等公共云提供商当天也推出了基于AMD EPYC Milan处理器的云实例。
在指令方面,EPYC 7003的主要新增功能包括:AVX2 VAES / VPCLMULQDQ、SEV-ES增强、Secure Nested Paging 、CET Shadow Stack、INVLPGB、PCID,MPK存储器保护密钥等。
Zen 3支持附加的AVX2指令,以实现更快的加密/解密性能。
AMD继续完善其安全加密虚拟化(SEV)加密状态代码。Zen 3中有新的调试寄存器和中断注入限制。自Naples以来,AMD一直在上游开发SEV代码支持主线Linux内核。
Zen 3的最大SEV功能是安全嵌套分页(SEV-SNP)。安全嵌套分页为SEV / SEV-ES添加了新的完整性功能,以防御恶意虚拟机管理程序。
EPYC 7003还支持控制流执行(CET)影子堆栈,防止ROP攻击。
Zen 3添加了INVLPGB指令来代替中断来广播页面无效。
Zen 3处理器支持进程上下文标识符PCID。
EPYC 7003还支持用户的MPK存储器保护密钥。
到目前为止,基于AMD EPYC Milan的测试均在Ubuntu 20.04.2 LTS和Ubuntu 20.10下进行的,在所有测试的服务器处理器中都使用了相同的软件堆栈。每个被测CPU均以其最大内存通道数和最大支持DDR4内存频率额定的内存运行。
首先Chess基准测试(包括Crafty,TCP,Lczero,Stockfish和Asmfish)的测试结果,从高端的EPYC 7742 2P到7763 2P,性能发生32%改进。同时,从EPYC 7F52 2P到EPYC 75F3高频SKU改进了73%。需说明一点:EPYC 7601 2P基于Naples旗舰32核/ 64线程芯片,而ROMA和Milan是旗舰64-核/128线程CPU。对于Chess基准,相比Cascade Lake系列,EPYC 7763 2P的速度比至强Xeon Platinum 8280 2P旗舰机型快77%。
接下来基于Linux内核,ImageMagick,LLVM,FFmpeg和Godot游戏引擎的编译结果来查看整体代码编译性能。从EPYC 7742 2P到7763 2P,性能发生14%变化,从7742 2P到75F3性能提高了19.5%。相比Xeon Platinum 8280 2P,EPYC Milan在代码编译性能方面约占33%优势。
从ROMA到Milan,世代相继取得了非常重大的进步。这里的“创建者”测试包括OSPray,Blender,Appleseed,LuxCoreRender,V-RAY,IndigoBench,OCRMyPDF,x264,x265,Kvazaar,dav1d,SVT-AV1,avifenc,libraw,Webp2,JPEG-XL,oneDNN,OIDN,OpenVKL ,OpenVINO,Basis Universal,ASTCenc,ETCpak,Godot编译,eSpeak,Synthmark和Ngspice。与英特尔的至强铂金8280 2P相比,高端产品的性能提高了24%,速度提高了41%。当前主要Linux发行版和各种企业Linux发行版中,对AMD EPYC 7003系列的Linux支持处于良好状态。您需要更新内核的一种情况是对Zen 3进行温度和能量监控,但除此之外,Linux的支持状况良好,尤其是在构建Rome平台时。一个令人沮丧的方面是编译器调整补丁的迟来性,我们希望AMD能够根据他们不断增长的HPC和数据中心市场份额,在继续增加更多Linux资源的同时努力解决这些问题。希望浏览到EPYC 7003系列的所有数据以及更多开源基准测试社区的数据的人,可以通过OpenBenchmarking.org查看所有EPYC 7003系列公共数据。 在接下来的几天中,FreeBSD上的EPYC 7003系列性能,以及基于GCC和AMD AOCC 3.0编译器其他Linux发行版基准性能将陆续发布。