北京时间10月29日凌晨1点,AMD正式发布了新一代Radeon RX 6000系列显卡,首批包括RX 6800、RX 6800 XT、RX 6900 XT三款型号,均基于RDNA 2架构、Navi 21核心,268亿个晶体管。
AMD Radeon技术事业部工程研发高级副总裁David Wang(王启尚)表示,作为RX 5000系列RDNA架构的后续,RDNA 2架构的任务目标是性能提升1倍、能效提升至少50%,并完整支持DX12 Ultimate等技术特性,而且全部都要在16个月的时间内完成,极具挑战。
最终,开发团队不但完成预定目标,甚至超额完成,实际性能表现几乎超出了所有人的预料。
首先要强调的一点是,RDNA 2 GPU架构和Zen 3 CPU架构如出一辙,都没有搭配新的制造工艺,还是原来的台积电7nm,只是工艺本身更成熟了而已,没有用上EUV光刻之类的,因此实际产品所有的性能、能效提升,全部都来自于架构本身的变革,更加不易。
计算单元一直是AMD GPU架构的基本模块,RDNA架构已经做了大刀阔斧的改革,RDNA 2进一步调校,包括无处不在的精细时钟门控、激进的流水线重平衡、重新设计的数据路径,最终带来了30%的能效提升。
Infinity Cache确实称得上是革命性的,它在Navi 21核心内加入了最多128MB的独立缓存,相比此前几百KB级别的缓存有了质的飞跃,能够以更高的带宽、更低的功耗,快速及时地处理GPU中的数据。
按照AMD的说法,Infinity Cache再加上256-bit GDDR6显存,相比于此前的384-bit GDDR6显存,带宽可以增加多达117%,功耗则可以降低10%。——这下知道AMD为什么显存位宽这么低了吧?
并且,这一缓存设计不需要游戏开发者特别优化才能支持和发挥强力,任何游戏都可以直接获益,当然开发者也可以继续深挖、提升。
高速设计方面主要是频率,工艺不变的前提下,RDNA 2的最高频率提升了足足30%,普遍超过2GHz,最高加速甚至超过了2.2GHz。
相比之下,RTX 20/30系列加速频率也只有1.7-1.8GHz的范围,相差了超过400MHz。
综合下来,RDNA 2的能效(每瓦特性能)相比于RDNA提升了足足54%,分别来自Infinity Cache带来的同频性能提升、更高的运行频率、整体设计优化带来的能效改进。
而且,这还是不是最高的幅度,往后看会有更大惊喜……
与此同时,RDNA 2对比RX 5700 XT还实现了大约2倍的性能提升,尤其是在4K超清分辨率下游戏性能出色,《生化危机3》等游戏的提升设置超过2倍,最多达到了2.2倍!
除了强劲的性能、能效,RDNA 2架构在技术特性方面也终于补全了,DX12 Ultimate、DXR光线追踪、VRS可变着色率、网格着色器(Mesh Shaders)、采样器反馈(Samper Feedback)这些在竞品上已有的,全部都已支持。
当然,仅仅跟进是绝对不够的,RDNA 2架构还有一大批自己的独门绝技,比如AMD FiedlityFX,就是一整套游戏图形技术的合集,包括对比适应性锐化、降噪、可变着色、环境光遮蔽、屏幕空间反射、超分辨率等等。
其中,超分辨率(Super Resolution)技术还是一个试验特性,新卡首发的时候将暂时缺失,优化到位后会通过驱动更新加入支持。
目前已有35款游戏支持AMD FiedlityFX,包括不少近期的热门大作,比如《尘埃5》、《神之陨落》、《魔兽世界:暗影国度》、《银河破裂者》、《孤岛惊魂6》,它们都会在近期放出视频,展示对于AMD技术的优化支持。
RNDA 2架构还支持新的“Rage Mode”(狂暴模式),可以实现一键自动超频,释放最大性能,而且这个功能不影响质保,不用担心会超坏,同时提供安静模式、均衡模式,适合不同应用场景,可随时保持最适合的能效状态。
需要注意的是,Rage Mode的开关、具体设置,取决于不同AIB品牌厂商对于不同型号的实际设置。
作为目前唯一同时拥有高性能CPU、GPU、芯片组的厂商,AMD的一个独特优势就是平台优化。RNDA 2架构不但继续支持PCIe 4.0,可以搭配锐龙3000/5000系列处理器、400/500系列主板发挥最佳性能,还支持“Smart Access Memory”(智能访问显存)技术。
以往的平台上,处理器只能访问显卡最多256MB的显存,而现在RX 6000系列显卡搭配锐龙5000系列处理器,后者可以访问全部的显存,而且它也是不需要游戏单独优化的。
AMD宣称,狂暴模式、智能访问显存联合加持之下,4K游戏中能额外带来最多13%的性能提升,这可是AMD独一无二的优势,N卡怎么搭配都不会有这种免费加成。
RDNA架构上提出的Radeon Boost加速技术、Radeon Anti-Lag抗延迟技术也发扬光大,结合FreeSync同步刷新技术,可以大大降低从键盘、鼠标操作,到显卡执行,再到显示器输出的延迟。
以4K分辨率下的《堡垒之夜》为例,上述技术可以将延迟从63ms降低到40ms,节省了足足37%,结果就是游戏响应速度更快、操作体验更加流畅。
AMD还提到了自己的一点优势,那就是采用标准设计,通用性更好,包括对机箱、供电、散热的兼容。
供电这块显然是针对RTX 30系列专门设计的12针供电接口,要么搭配转接线,要么重新设计的电源,非公版一个用的都没有。
好了,接下来该说具体产品了,首先是Radeon RX 6800 XT。
72组计算单元,4608个流处理器,核心游戏频率2015MHz、加速频率2250MHz,也就是几乎全程都能在2GHz以上运行,集成128MB Infinity Cache,搭配256-bit 16GB GDDR6显存,等效频率16GHz,带宽512GB/s,整卡功耗300W,双8针辅助供电。
RX 6800 XT相比于功耗高了20W的竞品RTX 3080,它在4K、2K分辨率下的游戏性能基本持平,不少游戏还可以略微领先。
即便考虑到官方数据和实际数据的差异、不同游戏的不同优化,RX 6800 XT的综合实力也能和RTX 3080基本处于同一档次,而且别忘了A卡一贯都是战未来,通过驱动更新会不断提升性能、新增特性(比如超分辨率)。
刚才说的狂暴模式、智能访问显存,更是锦上添花,不同游戏可以带来最多13%的额外性能提升,如此一来稳超RTX 3080就问题不大了。
然后是Radeon RX 6800。
60组计算单元,3840个流处理器,核心游戏频率1815MHz、最高加速频率2105MHz,Infinity Cache保持完整的128MB,显存还是256-bit 16GB GDDR6,而整卡功耗降至250W。
RX 6800的竞争对手是RTX 2080 Ti,当然不如说是与其性能几乎完全持平的RTX 3070,在智能访问显存的加持下,性能全面领先,从官方数据看最高幅度达到了惊人的34%,估计综合实力领先10%问题不大。
你以为这就完了?当然不是,One More Thing,还有旗舰级的Radeon RX 6900 XT!
它拥有完整的80组计算单元、5120个流处理器,核心游戏频率2015MHz、加速频率达2250MHz,同样的128MB Infinity Cache、256-bit 16GB GDDR6,而整卡功耗居然和RX 6800 XT一样都控制在300W。
如此一来,RX 6900 XT的能效更加突出,能效提升幅度达到了恐怖的65%。
游戏性能更是达到了和竞品旗舰RTX 3090基本持平的档次,部分游戏还有领先,功耗却低了50W!
恐怕这是谁都不曾想到的,之前的悲观预计甚至是RX 6900 XT只能接近RTX 3080,而此前在锐龙5000发布时,苏妈放出的RDNA 2性能预览,也迷惑了几乎所有人——当时普遍认为那是6900 XT,结果只是6800 XT。
这样一来,AMD就有了完整的新一代处理器、显卡产品阵容,完全进入4K游戏时代。
不过,想买到新卡还得等一等。
RX 6800、RX 6800XT预计将于11月18日在全球电商、零售商和AMD官网上市,国内售价分别为4599元、5099元,非公版包括华擎、华硕、迪兰、技嘉、微星、撼讯、蓝宝石、讯景和盈通。
RX 6900 XT预计将于12月8日上市,国内售价7999元。该卡目前只规划了AMD公版,非公版的情况会在发售前给出更多消息。
作为对比,RTX 3070、RTX 3080、RTX 3090的价格分别是3899元、5499元、11999元起。
AMD显卡的下一站将是RDNA 3架构,目前正在设计中,将采用更先进的工艺(Advanced node),至于具体是7nm EVU还是5nm,可能就是一个杀手锏,发布时间预计会在后年初。
另外,AMD还在推进专门针对高性能计算、深度学习的CDNA架构,将用于Radeon Instinct计算卡产品线。