北京时间2020年4月7日,英特尔正式发布第三代至强可扩展处理器双路型号,作为市场的主力型号,英特尔显然是有备而来。得益于先进的10nm工艺,除了整体规格配置上有大幅提升,性能有46%的提升以外,英特尔更愿意强调在场景优化和生态上的优势。
英特尔为其配备了最新的10nm制程工艺技术,标志着至强处理器正式进入10nm时代,下半年消费端十二代酷睿也将迎来10nm时代,看来,英特尔IDM能保证较为充足的产能供应,IDM模式在芯片非常短缺的2021年显得更有优势,能保障企业供应链的稳定性。
一个月前,英特尔新任CEO帕特基辛格宣布的IDM 2.0计划也是为了进一步强化这一优势。
先来看规格
此次发布了共计36个SKU信息(图来自:https://ark.intel.com/content/www/us/en/ark/products/series/204098/3rd-generation-intel-xeon-scalable-processors.html)
规格上,第三代至强可扩展处理器有最高40核(8380)的规格,与第二代相比,IPC提升达20%,与第二代28核的8280相比,平均性能提升了46%,AI推理性能也提升了74%。
性能提升数据(上一代8280 vs 新一代8380)
第三代vs第二代主要参数差异
此次发布的第三代至强可扩展处理器采用的是Sunny Cove微架构,缓存方面,L1L2L3 Cache与上代相比均有大幅提升。内存规格从6通道升级到了8通道,内存频率开始支持3200内存,内存容量从最高4.5TB提升到了6TB。核心间的UPI带宽也有所提升。
第三代vs第二代,常用Benchmark测试数据
IO方面,此次发布至强开始正式支持PCIe 4.0,提供64个PCIe通道,上一代仅提供48条PCIe 3.0通道,新一代至强搭配新一代的傲腾持久内存傲腾200系列以及P5800X NAND SSD使用效果更好。
有人会觉得PCIe 4.0出现会降低用户对于傲腾SSD的需求,其实,最新的支持PCIe 4.0的傲腾固态盘5800X不仅IOPS提升了4倍,而且相较于NAND固态盘延迟降低13倍,傲腾介质优势对于NAND有降维打击的效果,能更好满足非常严苛的SLA要求。
回应AMD,第三代至强可扩展处理器在架构上有优势
前不久,AMD发布第三代霄龙处理器,许多人非常期待看到英特尔在第三代可扩展处理器能做出回应,作为优势对比,英特尔在处理器架构上谈到了架构上的特点,以及在缓存和内存时延上的优势。
上图提到的是缓存的时延表现,英特尔认为许多关键型工作负载都需要一致的响应时间,才能提供一致的SLA,英特尔的L3缓存设计可以获得一致的响应时间,而AMD的第三代霄龙每个都有各自独立的缓存,会导致缓存访问时间的差异。
另外一个是DRAM时延优势,第三代至强的本地和远程访问时延比米兰最多低30%的水平(139ns vs 192ns),内存频率不仅提升到了3200,而且每个内存通道都可插两条内存。DRAM加上傲腾持久内存,可提供的内存容量为6TB,比隔壁AMD多2TB内存,在内存数据库等内存容量有要求的场景更有优势。
此次两路处理器一共发布了36个SKU,加上去年6月份发布的四路和八路型号,第三代至强可扩展处理器共有51个SKU,覆盖多个场景,加上英特尔在傲腾持久内存和SSD以及网络和FPGA加速器等产品上的布局,综合实力上,英特尔多样化的产品组合是AMD所不能比拟的。
强调场景优化的优势
很多时候,抛开场景谈性能都不靠谱,英特尔也更喜欢强调在特定工作负载优化时的优势。
为了优化场景,英特尔内置了多种加速指令集,VNNI、AVX-512、VPMADD52、SHA、VBMIAVX 512等多种指令集,使得包括HPC、云和AI推理等场景中的性能相对于没有这些指令集的AMD霄龙处理器有较大优势。
与两年前Q2发布的上代产品相比,新一代至强可扩展处理器在多个热门场景的性能方面均有大幅提升,并且给出了具体的参考数值,在云计算的延迟敏感型负载,在5G的网络和通信工作负载,在IoT场景中的图像分类场景,在HPC疫苗研发建模场景,在AI的语言处理推理等场景中都有非常可观的提升。
最懂AI的处理器:继续强调AI推理能力
英特尔一直在强调至强处理器的AI推理能力,作为目前业界唯一一个内置AI加速的数据中心级x86 CPU,英特尔此次发布又进一步加强了AI计算能力,与AMD霄龙7763相比,图像识别性能高出25倍,运行常见的20多种机器学习模型时,甚至比英伟达A100 GPU的性能还要高。配合软件上的优化,第三代至强在部分算法上的性能表现甚至能有百倍提升。
优化安全能力
安全性方面也有进一步强化。此次发布在至强上首次引入了SGX英特尔软件防护扩展技术,SGX可提供可信的执行环境。此外还采用了英特尔平台固件弹性技术来抗击DDoS,采用了英特尔密码操作硬件加速技术来减少加密计算对于性能的影响。
生态与市场
英特尔给出的数据称,自2017年发布以来,至强可扩展处理器的出货量超5千万块。由于2020年六月份发布的第三代至强可扩展处理器都是四路以及八路处理器,出货量会比较低,所以,五千万的出货量绝大部分都是前两代至强可扩展处理器贡献的。
有八百多家云服务商都使用了至强可扩展处理器,在云时代的背景下,英特尔更愿意强调在云以及多云环境中的价值。在发布会现场,国内市场上几乎所有的服务器厂商、云厂商以及独立软件开发商,都作为英特尔合作伙伴并见证了新一代至强可扩展处理器的发布。