图形处理器(GPU)的市场足够大,大到使英特尔几番跃跃欲试,意欲借其挽回今年以来显现的疲态。
根据数据提供商Statista的统计,2019年,全球GPU市场价值为197.5亿美元,其中的龙头英伟达就独享101.8亿美元。预测表明,到2027年,这一市场可能增至2008.5亿美元,从2020年到2027年的复合年增长率(CAGR)高达33.6%。
见此情形,PC时代的处理器“代名词”英特尔自然不甘落后,近日来先后发布PC用GPU和服务器GPU,继续冲击“大算力”时代的市场高地。
今天英特尔展示了一款市场期待已久的芯片,这是第一款面向服务器市场的独立GPU。为了将服务器GPU推向市场,英特尔正在与各种软件和服务合作伙伴合作,包括Gamestream、腾讯游戏和优必选。
其中,腾讯与英特尔合作,为其新的GameMatrix云游戏平台进行基于容量的服务器部署,该平台提供超过100款热门游戏。借助英特尔Xeon可扩展处理器——一个完整的软件堆栈和H3C XG310 PCIe附加卡,其中包含4个英特尔服务器GPU,腾讯现在可以以经济实惠的方式提供高密度、低延迟、低功耗的Android游戏解决方案。
“这是我们第一款用于数据中心的独立GPU,”英特尔副总裁Jeff McVeigh在接受采访时表示。“这确实提升了 Xe-LP 产品线的性能,它被部署在H3C的PCI Express卡中,并且真的是围绕Android云游戏和媒体流的一些关键工作负载,提供了非常可观的总拥有成本优势。”
当腾讯将游戏从云端服务于PC、游戏机和智能手机上的用户时,该款GPU就变得非常有用。如果单个GPU像这款英特尔服务器GPU一样可以为很多用户提供服务,那么像腾讯这样的公司就可以降低每用户成本,这在以前是很困难的。
以腾讯目前最受欢迎的手机游戏之一《传说对决》(Arena of Valor)为例,它对性能的要求很高。英特尔服务器GPU可以扩展到同时处理多个游戏流。使用H3C XG310 PCIe卡,英特尔可以以每秒30帧的速度,以720P的速度处理60个流媒体。
当使用两块卡时,英特尔可以同时流媒体120个用户,仍然是30帧/秒。通常情况下,在包含英特尔Xeon可扩展处理器的双卡系统中,H3C XG310卡可以支持大于100个同时用户,并且根据具体的游戏标题和服务器配置,最高可支持160个同时用户。
H3C板
“我们一直在与腾讯在该领域进行非常密切的合作,”英特尔副总裁Lynn Comp在接受采访时表示。“这个领域真正有趣的是我们能够支持的GPU密度和CPU支持的带宽之间的平衡。这是一个平衡良好的系统。达到每个GPU的高用户数对总拥有成本来说真的很重要。”
凭借其首款用于数据中心的独立GPU,英特尔正在进一步扩大其增强云游戏和媒体体验的软件套件。该公司的目标是Android云游戏和高密度媒体转码和编码应用,以实现实时的超顶视频流。
英特尔携手三巨头推出Iris Xe Max
在推出面向服务器的独立GPU前不久,英特尔还针对PC推出了Iris Xe Max 显卡,并宣布,宏碁、华硕和戴尔已签约成为其首批客户。这三家笔记本电脑制造商都推出了首次搭载该芯片的轻薄型笔记本电脑。
英特尔该型首款独立显卡芯片采用了与其第11代英特尔酷睿移动处理器中的集成显卡Iris Xe显卡相同的微架构,采用英特尔的10纳米Super Fin制造技术。但这款新的显卡功能更强大,拥有96个执行单元,频率为1.35GHz,并内置编码功能。市场总监Darren McPhee在接受采访时表示,内置编码功能对于内容创作者这一目标市场有较大便利,能帮助他们更快地处理视频。
“我们将这一解决方案瞄准了主流的轻薄笔记本,特别是移动创作者,”McPhee说。“这将是第一波产品的长期战略举措。我们正在关注如何在这个领域提高创作者的能力。”
这款芯片已经设计了几年,新的独立GPU将使英特尔能够更好地与独立显卡制造商英伟达和AMD竞争。英特尔表示,这只是在2021年向显卡市场战略推进的开始。
Iris Xe Max采用了英特尔Deep Link技术,该技术可以帮助英特尔的CPU与其GPU很好地协同工作,使用一个通用的软件框架来提升视频编码等方面的性能。英特尔表示,其GPU可以的Hyper Encode编码速度是英伟达GeForce RTX 2080台式机显卡快1.78倍。同时,2080比英特尔的图形解决方案消耗更多的电力,但2080现在正在被英伟达的新GeForce RTX 3080 GPU所取代。英特尔表示,还没能针对3080进行测试。
在具体的搭载产品上,英特尔Iris Xe MAX显卡可用于宏碁Swift 3x、华硕VivoBook Flip TP470和戴尔Inspiron 15 7000二合一笔记本电脑。这些都是首批采用第11代英特尔酷睿移动处理器、英特尔Iris Xe MAX显卡和英特尔Deep Link技术的设备。
英特尔表示,配备上述“打包”技术的电脑可以比配置第三方显卡的同类笔记本电脑运行基于AI的创作软件快7倍。
至于游戏方面,英特尔表示,Iris Xe Max显卡还能在各种流行游戏中提供1080p的画面。英特尔宣称,其GPU的游戏性能可以超越使用英伟达 MX350 Notebook GPU的笔记本电脑,而英伟达的3000系列 GPU的功耗要高得多。
在2021年初扩大推广GPU后,英特尔还将推出针对桌面图形性能的DG2显卡。虽然性能水平和发布时间还没公布。但英特尔严肃表示,将在2021年上半年推出 Xe 独立显卡,以提升台式机的性能。英特尔认为,Xe 显卡架构将从低端市场扩展到高端显卡市场,覆盖从游戏到数据中心显卡的各个领域。
另外,英特尔第11代英特尔酷睿S系列台式机处理器,代号为Rocket Lake,也将于2021年首次亮相。英特尔还在开发其Xe HPG高性能显卡,这种芯片消耗更多的电力,可以运行大功率的台式机。
OneAPI工具继续进化
除了芯片之外,英特尔还宣布将在12月发布OneAPI工具,以帮助客户更好地利用其新硬件。OneAPI 是英特尔推出的开源、基于标准的统一编程模型,旨在为从 CPU 到 GPU,再到 FPGA 等其他加速器的一系列硬件提供支持。在 2018 年年底正式宣布并于去年进入 Beta 测试阶段之后,今年9月底英特尔发布了 1.0 正式版。
英特尔副总裁Jeff McVeigh表示,OneAPI计划意味着英特尔将在其所有芯片上运行它们的应用工作负载、中间件、框架、语言和库。
“有了 OneAPI,我们真正想要实现的是扩大架构的多样性,以支持这些架构的工作负载和统一编程模型,”McVeigh说。“我们已经有了一个基于标准的解决方案,我们会将其大范围推广。”
英特尔的野心是,软件经过优化,可以在不同的英特尔处理单元,即所谓的 XPU之间运行,而且运行得更好。McVeigh表示,XPU愿景意味着英特尔可以在硬件方面提供混合架构,在软件方面提供统一的体验,这应该会让开发者更加轻松。
而“XPU”战略的设想依据也很好理解,随着我们日益接近一个拥有数十亿智能设备和数据成倍增长的时代,传统的CPU模式将需要转向跨CPU、GPU、FPGA和其他加速器的混合架构模式。
英特尔表示,英特尔服务器GPU的推出是该公司在XPU时代扩展产品的又一步骤。这个时期也需要一个全面的软件堆栈。开发者将能够通过英特尔的OneAPI工具在英特尔XPU中访问一个通用、开放和基于标准的编程模型。
通过OneAPI,开发人员可以为他们试图解决的特定问题选择最好的架构,而不必为下一个架构和平台重新编写软件。
在英特尔DevCloud上,开发者可以在各种英特尔架构上测试代码和工作负载,同时DevCloud也在扩展,包括新的英特尔Iris Xe显卡。
目前,OneAPI已经获得了业界的支持,包括最近微软Azure和TensorFlow的认可。一些领先的研究机构和大学也认可OneAPI。此外,伊利诺伊大学贝克曼先进科学与技术研究所也宣布成立一个新的OneAPI卓越中心(CoE)。该大学正在使用OneAPI编程模型将生命科学应用纳米级分子动力学(NAMD)扩展到更多的计算环境中。
大数据时代需要多架构、全场景的芯片技术,在2018年提出XPU战略之前,英特尔就一直朝着这个目标努力。而如今,在服务器GPU和PC用GPU再拿下一城之后,这个昔日芯片霸主的愿景也更近了一步。