不久前,MC给大家分享了第三代AMD EPYC(霄龙)处理器(下文简称第三代AMD EPYC处理器)的详细技术解析,可以看出全新的Zen 3架构让这一代处理器的浮点性能、分支预测能力、安全性等方面均有着非常明显地提升。通过架构设计的改进,AMD宣称第三代AMD EPYC处理器的IPC在上一代产品的基础上提升高达19%。那么第三代AMD EPYC处理器在实际应用中的性能上究竟提升了多少呢?在AMD的大力支持下,我们特别针对第三代AMD EPYC处理器进行了独家测试。
参测处理器规格解析
MC本次测试的对象是AMD EPYC 7763、EPYC 7713、EPYC 75F3这3款处理器,下面我们首先来看看它们的规格参数。EPYC 7763是第三代AMD EPYC处理器中综合性能最强的一款产品,它采用64核128线程设计,基准频率为2.45GHz,Boost频率最高可达3.5GHz,TDP为280W。EPYC 7713同样采用64核128线程设计,其频率设定是2.0GHz~3.675GHz,相比EPYC 7763,前者的基础频率稍低,同时其Boost频率要更高一些。
此外,EPYC 7713的TDP为225W,比EPYC 7763更低一些,所以前者更适合应用在需要更强单核计算性能和更低功耗的场景。第三代AMD EPYC处理器中包含4款命名带有“F”的产品,采用这种命名方式的主要目的是突出它们拥有更高的单核心Boost频率,而在这4款产品中,EPYC 75F3的综合性能最强。它采用32核64线程设计,基础频率为2.95GHz,Boost频率高达4.0GHz,TDP则为280W,它更适合应用在一些对处理器频率要求较高的场景中。
▲MC本次测试选择的是AMD EPYC 7763、EPYC 7713、EPYC 75F3这3款处理器(图为EPYC 7713和EPYC 75F3)
当然,以上3款处理器均由经过升级的台积电7nm工艺打造,并基于AMD最新推出的Zen 3架构,它们均拥有容量高达256MB的三级缓存,同时也最高支持8通道DDR4 3200内存,内存带宽(每路)高达204.8 GB/s。如果你想要进一步了解第三代AMD EPYC处理器的详细技术内容,不妨参阅MC于3月16日发布的《Zen 3架构打造、最高64核心!AMD EPYC 7003系列处理器技术架构解析》一文。
性能测试
下面我们来了解一下测试平台。本次测试统一考察的是双路系统的性能,并且统一使用的是AMD DAYTONA_X主板,搭配DDR4 3200内存(32GB×16)。为了让大家对第三代AMD EPYC处理器的性能有更加直观的认识,MC还会将EPYC 7763、EPYC 7713、EPYC 75F3这3款处理器的测试成绩与第二代AMD EPYC处理器的旗舰级产品EPYC 7742进行对比。需要说明的是,由于C-Ray 1.1和Sysbench的测试方法更新,EPYC 7742的测试成绩不再具备对比性,所以在这两项测试中,我们将重点考察EPYC 7763、EPYC 7713、EPYC 75F3这3款处理器的性能表现。
▲我们本次测试统一考察的是双路系统的性能
▲测试平台均使用的是美光DDR4 3200 ECC内存(32GB×16)
▲测试平台均使用的是三星860 PRO 256GB SSD
第三代AMD EPYC处理器双路系统测试平台一览
处理器:EPYC 7763×2、EPYC 7713×2、EPYC 75F3×2
内存:DDR4 3200 ECC 32GB×16
主板:AMD DAYTONA_X(BIOS版本:RYM1001D)
硬盘:三星860 PRO 256GB SSD×2
操作系统:Ubuntu 20.04
EPYC 7742双路系统测试平台一览
处理器:EPYC 7742×2
内存:美光DDR4 3200 ECC 32GB×16
主板:AMD DAYTONA_X(BIOS版本:RDY1001C)
硬盘:美光9300 3840GB SSD×3
操作系统:Ubuntu 19.04(用于测试SPECrate 2017)
CentOS 7.6(用于测试其他项)
SPECrate 2017
SPECrate 2017测试的是在单位时间内运行的实例数量,这是服务器采购时的主要性能指标,所以服务器厂商和处理器厂商通常提供的是这一测试成绩。在SPECrate 2017中包含SPECrate Integer和SPECrate Floating Point,前者测试的是整型并发性能,后者测试的是浮点并发性能。
我们的测试成绩显示,相比双路EPYC 7742,双路EPYC 7763在SPECrate 2017中的性能提升非常明显。例如在SPECrate2017_int_base中,双路EPYC 7763的得分为777分,而双路EPYC 7742在该项测试中的测试成绩则为682分,前者的性能提升约14%。而在考察处理器浮点运算性能的SPECrate 2017_fp_base中,双路EPYC 7763的测试成绩为610分,以17%的性能优势大幅领先双路EPYC 7742。值得一提的是,SPEC的官网数据显示双路EPYC 7763的SPECrate 2017_fp_base测试成绩达到629分,相比双路EPYC 7742,前者的性能优势进一步扩大到20%。
EPYC 7713和EPYC 7742的TDP虽然都是225W,但得益于更先进的Zen 3架构和更高的Boost频率,双路EPYC 7713在SPECrate 2017中的表现全面领先双路EPYC 7742。其中,双路EPYC 7713的SPECrate2017_int_base测试成绩领先双路EPYC 7742约9%,而在SPECrate 2017_fp_base中,双路EPYC 7713的性能优势更是达到14%。
正如前文所述,EPYC 75F3是一款采用32核64线程的处理器,它却在SPECrate 2017中带来了亮眼的表现。首先,在SPECrate 2017_int_base中,双路EPYC 75F3的得分为556分,相比上一代旗舰级产品EPYC 7742组成的双路系统,前者仅落后约23%。更加喜人的是,在SPECrate 2017_fp_base中,双路EPYC 75F3的性能表现已经达到双路EPYC 7742的水准。
综合SPECrate 2017的测试成绩我们不难发现,第三代AMD EPYC处理器在浮点运算方面的性能提升非常喜人,这自然要归功于Zen 3架构在浮点计算部分的加强。同时,得益于更大的执行窗口,以及专用分支预测和地址选择器的加持,第三代AMD EPYC处理器在整数运算上的性能也得到增强,这一点也在SPECrate 2017的测试成绩中得到充分体现。
Stream-Traid
Stream是业界广为流行的综合性内存带宽实际性能测量工具之一。和硬件厂商提供的理论最大内存带宽不同,通过fortran和C两种高级且高效的语言编写完成的Stream,可以在测试中充分发挥出内存的能力。Stream一共包含Copy、Scale、Add和Triad这4种操作,其中Triad组合了前面3种操作,所以其测试成绩更具参考价值。
对比参测处理器的规格参数我们不难看出,第三代AMD EPYC处理器的每路理论内存带宽和EPYC 7742保持一致。从我们的测试成绩来看,参测的3款第三代AMD EPYC处理器各自组成的双路系统,在这项测试中的实际内存带宽基本保持一致,同时还小幅领先双路EPYC 7742。
NAMD
NAMD是一种并行的分子动力学代码,由伊利诺伊大学厄巴纳-香槟分校贝克曼高级科学与技术研究所的理论和计算生物物理学小组开发,它主要用于大型生物分子系统的高性能模拟。本次测试中,我们主要通过NAMD来考察参测处理器的浮点性能。
从我们的测试结果可以看到,在核心数和线程数相同的情况下,得益于更高的基础频率,以及浮点性能上的提升,双路EPYC 7763在NAMD中以3%左右的优势胜过双路EPYC 7742。此外,测试成绩显示双路EPYC 7713的表现要比双路EPYC 7742稍逊一筹,我们认为这是EPYC 7713的基础频率比EPYC 7742稍低一些所致。
OpenSSL
OpenSSL广泛用于保护服务器之间的通信,这是许多服务器堆栈中的重要协议。OpenSSL测试主要包含生成签名和验证签名两部分,我们在本次此时中主要进行了生成签名测试。
测试成绩显示,双路EPYC 7763在我们的测试中每秒钟可生成27163.2个签名,其签名效率比双路EPYC 7742快2%左右。此外,即使EPYC 75F3的核心数和线程数仅为EPYC 7742的一半,但EPYC 75F3处理器“高频”这一特点让它在OpenSSL中表现不俗——双路EPYC 75F3在本次测试中生成签名的效率可以达到双路EPYC 7742的66%左右。
UnixBench Dhrystone 2和 Whetstone测试
本项目主要用于测试Unix系统性能,其中包括测试字符串处理的Dhrystone 2 using register variables和测试浮点操作的速度和效率的Double-Precision Whetstone这两个测试项目。此外,在这两个测试项目均可选用单线程或多线程进行测试,本次测试我们使用的是多线程。
第三代AMD EPYC处理器强大的浮点运算性能在这部分测试中得到充分展现。例如在Double-Precision Whetstone这一测试项目中,双路EPYC 7763的测试成绩远超上一代定位旗舰的双路EPYC 7742,领先幅度高达40%,同时双路EPYC 7713也在这项测试中领先双路EPYC 7742约34%。更令人欣喜的是,双路EPYC 75F3在这部分测试中的性能表现可达双路EPYC 7742的89%。
而在Dhrystone 2 using register variables这一测试项目中,第三代AMD EPYC处理器的表现同样比较亮眼。例如相比双路EPYC 7742,双路EPYC 7763和双路EPYC 7713的测试成绩分别领先约17%和3%,同时双路EPYC 75F3的性能也可以达到双路EPYC 7742的78%左右。
C-ray 1.1
C-ray是一种常用的光线追踪基准测试,可以显示多线程工作负载下处理器的差异,时间越短说明系统性能越强。在本次测试中,我们使用了4K和8K这两种分辨率进行测试,从而对比参测系统在不同负载下的性能差异。
得益于较高的核心频率,双路EPYC 75F3在C-ray中的表现比较亮眼。虽然其核心数和线程数仅为双路EPYC 7763的一半,但得益于较高的核心频率,双路EPYC 75F3在4K分辨率下完成测试任务仅比双路EPYC 7763多耗时约1秒,而且即使在8K分辨率下,双路EPYC 75F3完成测试任务的耗时也只是比双路EPYC 7763多耗时约6秒。
Sysbench CPU测试
Sysbench是一款被广泛使用的Linux基准测试,它可以对CPU进行性能测试,在测试中主要是通过CPU进行质数加法运算,本次测试使用的质数极限为10000个。
我们的测试成绩显示,双路EPYC 7763每秒可完成487771轮运算,而双路EPYC 7713的性能约为双路EPYC 7763的92%。值得点赞的是,双路EPYC 75F3每秒也能完成304232轮运算,其性能约为双路EPYC 7763的62%左右。虽然EPYC 75F3的核心数和线程数仅为EPYC 7763的一半,但我们认为更高的基础频率是前者的“加分项”。
目标:继续强化服务器领域的市占率
总览本次测试结果我们不难看出,Zen 3架构让第三代AMD EPYC处理器的综合性能得到大幅增强。例如,在保持核心数和线程数相同的情况下,双路EPYC 7763在浮点运算性能相对双路EPYC 7742有了跨越式的提升。同时即使核心数和线程数仅为双路EPYC 7742的一半,但双路EPYC 75F3的浮点性能也可以与之媲美。
不仅如此,得益于更大的执行窗口,以及专用分支预测和地址选择器的加持,第三代AMD EPYC处理器在整数运算上的性能也得到增强,这一点也在本次测试中得到充分体现。再加上第三代AMD EPYC处理器提升了三级缓存应用和内存配置上的灵活性,以及大幅增强的安全性。不仅如此,第三代AMD EPYC处理器还针对不同客户、不同场景推出了包含“F”系列产品在内的多个细分产品线,共计19款产品,整个产品布局非常完善。
与此同时,AMD仍然在重点打造其EPYC处理器的生态系统。AMD也宣布,预计到2021年底,AMD EPYC处理器将与包括亚马逊、思科、联想、腾讯云在内的众多合作伙伴携手合作,为其生态系统带来超过400个云实例以及超过100个新OEM平台。因此我们认为,第三代AMD EPYC处理器将帮助企业用户从容应对各种复杂的IT挑战,并成为AMD斩获更多数据中心市场占有率的新一代战略性产品。