英伟达分享RTX 4090演示性能数据和新特性的更多细节

2022-09-23 13:04
摘要:在面向媒体的一场闭门演讲中,英伟达揭晓了定于 10 月 12 日正式到来的 GeForce RTX 4090 显卡的首批性能数据。尽管公开演示的参考点有些模糊,但外媒还是在幻灯片中看到了一组在 DLSS 性能模式 / 4K 超分辨率下的 F..

在面向媒体的一场闭门演讲中,英伟达揭晓了定于 10 月 12 日正式到来的 GeForce RTX 4090 显卡的首批性能数据。尽管公开演示的参考点有些模糊,但外媒还是在幻灯片中看到了一组在 DLSS 性能模式 / 4K 超分辨率下的 FPS 性能数据。此外演示平台使用了英特尔酷睿 i9-12900K 处理器,搭配 32GB 内存、且安装了 64 位的 Windows 11 操作系统。

所有测试都是在支持第三代深度学习超级采样(DLSS 3)的游戏中进行的,凸显了这项新技术对于性能的极大助推作用,而后英伟达还提到了今明两天的内容。

今日游戏:

《微软飞行模拟器》-- 103 FPS

《战锤 40K:暗潮》-- 138 FPS

《虚幻引擎 5 - Lyra》光追演示 -- 155 FPS

《F1 22》光追演示 -- 204 FPS

《Unity Enemies》光追演示-- 89 FPS

《赛博朋克 2077》光追演示-- 141 FPS

明日游戏:

《赛博朋克 2077》光追最高档 / Overdrive 模式 -- 90 FPS

《NVIDIA Racer RTX》完全光追演示 -- 80 FPS

《Justice》完全光追演示 -- 81 FPS

《Portal RTX》完全光追演示 -- 117 FPS

如你所见,GeForce RTX 4090 能够显著提升支持高级光追特性的游戏性能。

● 比如《微软飞行模拟》和《战锤 40K:暗潮》仅获得 2 倍性能提升;

●《UE5 Demo》和《F1 22》可实现将近 3 倍提升;

●《Unity Demo》和《赛博朋克 2077》更是接近 4 倍提升。

CD Projekt RED 的游戏将很快更新支持 RT Overdrive 模式,启用 DLSS 3 后的 RTX 4090 可带来 4 倍速度提升体验 ——《Racer RTX》大约是 4.5 倍、《Justice》几乎 5 倍、《Portal RTX》也接近 6 倍。

然后英伟达探讨了 Ada Lovelace GPU 架构的专属优化光追硬件,可知率先引入光追的《战地 5》,每像素只需执行 39 次 RT 操作。但更先进的游戏 —— 比如《赛博朋克 2077》超速模式 —— 会大幅提升到 635 次。

首先是被称作着色器执行的重新排序,英伟达 GPU 工程高级副总裁 Jonah Alben 解释称:

在光追游戏中,如果一些光线照射到场景的不同区域,那么它们将无法运行相同的程序、并于首次光线运算后闲置。

好消息是,通过在光追管道中添加一个新的阶段,SER 能够结合在同一程序上运行的光线,从而提升效率。

据英伟达所述,SER 在《赛博朋克 2077》游戏中实现了显著的性能提升:

● Overdrive Mode —— 提升 44%

● Portal RTX —— 提升 29%

● Racer RTX —— 提升 20%

另一项 Ada Lovelace 架构创新,是英伟达为 RTX 40 系列带来的 DMM 置换微网格:

作为针对几何体的光追优化,第三代 RT 核心能够理解并处理优化的 BVH 包围体层次结构。

在改进 BVH 构建性能的同时,它还减少了对存储资源的需求,而且 Simplygon 和 Adobe 工具都将支持 DMM 。

最后,不透明度微贴图可使 RT 核心更易理解不规则物体该如何受到光线的影响 —— 该功能通过包含预定不透明状态(如半透明、不透明或未知)的蒙版而实现。

得益于此,OMM 可节省返回 SM 处理单元的时间、并在多项演示中将性能提升 10% 。至于和 DLSS 3、SER、DMM 和 OMM 相关的更多细节,还请耐心等待官方揭晓。

更新于:2022-09-23 13:04