3DMark获得全面光线追踪功能测试

章彦凡
导读 最好的显卡不仅需要在性能和价格上竞争,更需要在功能上竞争。由于RX 6900 XT、RX 6800 XT和RX 6800都是加入英伟达通过硬件支持

最好的显卡不仅需要在性能和价格上竞争,更需要在功能上竞争。由于RX 6900 XT、RX 6800 XT和RX 6800都是加入英伟达通过硬件支持光线追踪,所以我们很想知道它们在性能方面的对比如何。在我们的GPU基准测试系统中,谁将获得最高荣誉,如果启用光线追踪,情况将如何变化?

多年来,游戏中的光线追踪一直备受关注。记得2008年《雷神之锤4敌人领土》 (Quake4Enmy领地)我有原型光线追踪模块的时候。看起来很酷,但性能很差。在16核CPU上玩16 fps 720p?但至少这是件好事!

经过十年的闪存,Nvidia的RTX硬件承诺卓越的质量和性能。除了RTX卡,游戏仍然使用混合渲染方法,其中大部分是由传统方法完成的。光线跟踪仅在事后应用,以实现一些特定的效果,如反射或阴影。

以如今支持光线追踪计算的现代GPU,在游戏上进行全路径追踪需要做什么?雷神之锤2 RTX和《我的世界》RTX已经做到了这一点,但他们是更老的和更简单的游戏,具有路径跟踪功能。现在,UL为3DMark添加了一个功能测试,该测试在皇家港口基准上执行资产的全光线跟踪渲染。(请注意,您需要高级版或专业版才能访问DirectX光线跟踪功能测试,这就是所谓的测试。)

我们喜欢能够在各种GPU上比较“纯”光线跟踪性能的想法。3DxR功能测试现在为我们提供了另一种方法。虽然它没有报告每秒光线/三角形相交的数量(这是我们真正想看到的),但它确实提供了与光线跟踪硬件的直接关联。我们总结了目前的RTX GPU,以供参考。更重要的是,我们应该看到AMD即将推出的大Navi,RX 6900 XT,RX 6800 XT,RX 6800都将在下个月左右推出。

我们已经通过DXR功能测试运行了所有的RTX卡,除了RTX 2070和2080(它们应该在新的超级变体之间)。GeForce 3090 RTX的性能是RTX 2060的4倍,RTX 2080钛的速度是2060位的两倍多,GeForce 3070 RTX略快于2080钛。RTX 3090也比GeForce RTX 3080快19%,比我们测试过的大多数游戏都要大。基本上这里的东西更多的是受到GPU的限制,所以理论上的表现终于接近现实了。

有多近?我们用RT核的数量,GPU时钟和RT核的生成来计算一些数字。英伟达表示,第二代30系列RT内核比第一代20系列RT内核快70%左右。例如,这意味着3070应该比2080 Ti FE快7%左右,而2080 Ti应该比RTX 2060快150%。

30系GPU的扩展几乎和预期的一模一样。3070确实比2080 Ti快7%,3080比3070快48%(预期47%),3090比3080快19%(预期19.5%)。

然而,最终,20系列零件上的结果变化更大。2060超级版比2060快14%(预计11%)。但是2070超只比2060快35%(理论上快41%),2080超快65%(理论上快73%),2080 Ti快127%(理论上快150%)。尽管如此,这已经足够接近值得尊敬的行为了,也是一个好的起点。

我们也想在一些非RTX的GPU上运行DXR功能测试,但它基本上是在嘲笑我们和我们的硬件。“你们这些无足轻重的GTX 1660超级和GTX 1080 Ti都搞不定光线追迹的真相!”实际上,它告诉我们,我们的硬件不支持运行测试所需的DXR Tier 1.1特性集。对于GTX上的DXR,这是通过驱动程序和着色器黑客:光线跟踪硬件加速是必要的。

更大的问题:AMD的RX 6800、RX 6800 XT、RX 6900 XT相比RTX 3070、RTX 3080、RTX 3090的价格如何?从理论上估计,6900 XT可能会在3070-3080之间的中间位置落地,而6800 XT会比3070快一点,RX 6800会在2080 Ti-2080 Super之间。但理论上的性能估计可能与实际情况不符,我们绝对有兴趣在本月晚些时候看看情况如何。

关于3DMark DXR功能测试还有很多可以讨论的地方。比如,它并不像我们预期的那样工作。默认情况下,它被设置为以1440p像素渲染,每个像素12个随机样本,并且像大多数路径跟踪算法一样,这些样本的输入被组合以给出最终的像素颜色结果。然后重新采样,提高了结果质量。通常,这个过程会一直重复,直到达到要求的质量水平。

问题是3DMark DXR特性测试实时执行所有采样和累积。样本计数指定了累积速率,并在对象移动时直接影响图像质量。但是,一旦相机停止移动,您最终将获得每个场景相似的最高质量结果(在相同的总时间之后)。

使用

2采样设置时,相机开始移动时,与默认的12采样设置相比,物体看起来有点颗粒感,而默认设置为12采样设置。但是,一旦相机暂停几秒钟,屏幕上的结果就会开始迅速收敛。查看这些图像质量比较。

同一场景的上述画廊展览图片右后摄像机暂停,直到只是之前它再次开始转动。因此,前三个“开始”图像是“最差”质量,而三个“结束”图像是“最佳”质量。请注意,屏幕抓图来自使用ShadowPlay进行的视频捕获,因此您应该忽略一些压缩伪像。这是为了使每种设置的捕获相同帧变得更加容易。(这些结果来自RTX 2080 Ti。)

视频压缩伪影会掩盖您在场景运动时会看到的许多其他噪声,尤其是在2采样设置上。但是,即使在稳定图像的时间很短的情况下,也要检查图像看起来有多相似。三个“最终”结果基本相同,唯一的区别是随机采样的播放方式。但是,到目前为止,最大的因素是性能。

使用RTX 2080 Ti,默认12个样本的平均性能为30.2 fps。每个像素下降到两个样本,性能将跃升至165 fps,而将采样数增加到每个像素20个样本,则性能将仅下降至18.1 fps。换句话说,每帧每像素的采样数几乎直接影响性能。

我想看到的是一种在各种样本计数之上运行的深度学习衍生降噪算法。当然,默认情况下2样本图像质量非常嘈杂,但是Quake II RTX也是如此。请看以下示例:

“嘈杂”图像的运行速度提高了15%至25%,但是如果您实际上是想制作一款可玩的游戏,它的作用会更大。然后的目标是做足够的样本以获得可以转换为更好看效果的图像。想想DLSS,但除了上调幅度外,它还可以消除噪声并以一致的方式在各个像素之间进行插值。

获得接近完美的路径跟踪结果所需的每个像素的随机样本数通常为数百。对于实时游戏应用而言,这不会很快发生。但是,Quake II RTX允许您调整用于照片模式的样本数量,范围从100到8000。

最多需要一分钟的时间来渲染1080p的单个帧,而100个样本可以很快完成。同时,图像质量在基线100个样本以上不会有太大变化,但是如果您要渲染比Quake II更复杂的游戏可能会更重要。

选择更多的样本,更低的性能和更高的图像质量;或更少的样本,更好的性能和更低的图像质量。在游戏中,要想在质量和性能之间找到一个良好的平衡,就需要利用更高质量的光线跟踪渲染技术。在照片模式之外,Quake II RTX每个像素仅使用几个样本,并且可以轻松达到RTX显卡上的可玩性能。

当然,还有几个问题。首先,为了进行去噪,它是否需要Nvidia的Tensor内核,还是可以通过FP16在常规GPU着色器上完成(使其与AMD GPU兼容)?它将对性能产生多大影响?

更重要的是,完全光线追踪的游戏或图形是否重要的​​问题。当前的光线追踪游戏通常使用混合渲染方法,光栅化处理大多数底层图形,并且光线追踪效果仅用于反射,阴影或全局照明之类的事物。但是,如果混合渲染可以在以更快的速度运行时获得相同的视觉效果,那不是最佳的整体效果吗?

一个问题是,混合渲染需要用于传统栅格化的所有代码以及用于光线跟踪的代码,这意味着游戏开发人员可能需要做更多的工作。再说一次,由于虚幻引擎和Unity中内置了对光线跟踪的支持,这比您可能遇到的问题要少。无论如何,我们不太可能在不久的将来放弃栅格化。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!

上一篇如何设置手机QQ群的搜索模式?

下一篇LG 34BK95CW34寸曲面IPS显示器七折以上优惠