电脑游戏性能测试网站 电脑游戏性能测试 在线电脑性能测试游戏


电脑游戏性能测试网站 电脑游戏性能测试 在线电脑性能测试游戏

文章插图
NVIDIA GeForce RTX 20系列GPU的诞生让实时光线追踪这一概念被众多游戏玩家所熟知 , 反射、阴影、全局光照等渲染效果让游戏玩家体验到了光线追踪的魅力 , DLSS技术则让玩家在享受逼真渲染效果的同时还能获得足够流畅的游戏帧率 。去年9月 , NVIDIA GeForce RTX 30系列GPU携第二代RT Core和升级后的Tensor Core而来 , 给玩家提供更畅爽的光追体验是它的使命之一 。或许是认识到光线追踪将成为游戏大作的主流配置 , AMD也推出了支持光线追踪的Radeon RX 6000系列GPU 。那么对于想要畅玩光追游戏的玩家来说 , 什么GPU更值得购买呢?针对这一问题 , 我们决定用测试结果来给你答案 。
理论战力对比在进行实测对比之前 , 我们不妨先通过NVIDIA GeForce RTX 30系列和AMD Radeon RX 6000系列GPU的规格参数来对比它们的“理论战力值” 。NVIDIA GeForce RTX 30系列GPU(下文简称RTX 30系列GPU)基于目前最新的NVIDIA Ampere架构 , 该架构采用改进的Streaming Multiprocessor (下文简称SM)  , 它由不同核心、单元以及内存构成 。
NVIDIA Ampere架构SM的一大变化是FP32操作的吞吐量变为两倍 。为实现这一目标 , 新数据路径设计是每个SM分区每时钟能够执行32个FP32操作 , 所有四个SM分区组合在一起 , 每个时钟可执行128 FP32操作 。这能带来什么好处呢?简单来说 , 图形、计算操作和算法、现代着色器工作负载通常混合使用FP32算术指令 。FP32加速也有助于光线追踪降噪着色器 。光线追踪渲染工作负载越大 , 相对于上一代产品的性能提升越大 。
和RTX 20系列GPU相比 , RTX 30系列GPU的RT Core和Tensor Core均进行了增强 。其中 , RTX 30系列GPU搭载的是第二代RT Core 。NVIDIA的数据表明 , 第二代RT Core的性能达到上一代的两倍左右 , 同时其运动模糊渲染效率更是达到上一代RT Core的8倍 。
电脑游戏性能测试网站 电脑游戏性能测试 在线电脑性能测试游戏

文章插图
▲光线追踪过程简介和硬件实现方法介绍
电脑游戏性能测试网站 电脑游戏性能测试 在线电脑性能测试游戏

文章插图
【电脑游戏性能测试网站 电脑游戏性能测试 在线电脑性能测试游戏】▲NVIDIA在RTXGPU的RT核心上的实现方法
在GPU上引入Tensor Core(中文名为“张量核心”)是NVIDIA近年来的一大创举 。RTX 30系列GPU上搭载的是第三代Tensor Core , 其主要特点是支持更多的数据格式 , 大幅度加强了在稀疏矩阵计算时的效能 。比如在原始矩阵具有稀疏性时 , 第三代Tensor Core的速度可达到第一代的20倍等 。而在实际游戏中 , 第三代Tensor Core提供的就是玩家熟悉的NVIDIA DLSS功能 , 其主要作用是在游戏中有效遏制帧率下降 , 同时还能提供优秀的画质表现 。目前 , NVIDIA DLSS已经更新至2.1版本 , 并在游戏中提供了质量、平衡、性能和超性能这4种模式供玩家选择 。
电脑游戏性能测试网站 电脑游戏性能测试 在线电脑性能测试游戏

文章插图
▲面向图形的安培架构也加入了第三代张量计算核心 , 专门为稀疏矩阵优化 。
此外 , 引入光线追踪动态模糊加速也是基于NVIDIA Ampere架构的第二代RT Core上一个重要的技术创新 。动态模糊是一种非常流行且重要的计算机图形效果 , 它可用于游戏、电影以及许多专业渲染应用程序中 。从原理上来讲 , 动态模糊的本质和胶片摄影相关 , 因为胶片摄影时 , 图像不是立即创建的 , 而是通过将胶片在有限的时间段内曝光来创建的 。这意味着目标物体在胶片快门时间内的高速移动将带来模糊的曝光效果 。如果GPU想要创建类似效果 , 必须模拟相机和胶片工作流程 。动态模糊对于电影是非常重要的 , 它能够避免画面出现断续卡顿的情况 , 对游戏来说亦是如此 。
电脑游戏性能测试网站 电脑游戏性能测试 在线电脑性能测试游戏

文章插图
▲RTX 30系列GPU上的动态模糊光线追踪实现方法和具体结果
AMD Radeon RX 6000系列(下文简称RX 6000系列)GPU是AMD第一代支持硬件光线追踪渲染的产品 。该系列GPU基于AMD最新推出的RDNA 2架构 , 并通过引入硬件光线追踪单元(下文简称:RA单元)以实现对硬件光线追踪渲染的支持 。目前的资料显示 , RDNA 2架构的每个CU单元配备1个RA单元 , 同时AMD宣称RA单元的光线追踪交叉性能是传统软件执行的10倍 。数据显示 , RDNA 2架构的GPU在微软DXR SDK的Procedural Geometry的测试中带来了471fps的成绩 , 在软件模拟下只有34fps , 因此性能达到了软件的13.8倍 。实际上Procedural Geometry只是整个DXR SDK中的一部分 , 用于测试地面以上所有对象在光线追踪上的性能 , 其图元信息包括解析几何、体积几何和带符号的距离几何等多重内容 。