gtx2080,rtx2080


如何评价RTX2080与RTX2080TI?

gtx2080,rtx2080


就像刚刚过去的苹果发布会一样,NVIDIA每一代的新旗舰显卡的发布在玩家心目中也完全可以被当做一场“科技春晚”,只不过最近的“春晚”周期横跨了2016-2018三个年头,间隔长达两年零三个月 。或许也只有这样一个破纪录的更新周期才能消化2016年5月发布会上Pascal架构产品那令人震惊的性能跨越 。这也让我们看到老黄在2018年新品发布会上拿出新款“核弹”时有了更多的期待 。
按照惯例,笔者在第一时间拿到了这两款国内外玩家翘首以盼的新显卡——”GeForce RTX 2080Ti和GeForce RTX 2080“ 。规格参数一览以TU102和GP102核心为例,从规格上来看,CUDA核心的数量增长并不是非常夸张,相对而言最大的变化就是增加了用于光线追踪的RT Cores 和深度学习用的Tensor Cores 。
这也是这一代显卡最重量级的升级 。新成员的加入也让图灵架构的显卡核心面积大幅度增加 。TU102相比GP102在面积上就增加了60% 。相应的频率也有所增加,但幅度相对较小 。TU102核心透视实拍TU102的晶体管数量达到了186亿,而前一代GTX 1080Ti所使用的GP102则只有118亿,增加了57% 。
这颗GPU核心也顺理成章成为了目前规模最大的游戏显卡核心 。巨大的规模带来的副作用就是潜在的功耗和发热量的增加 。相比两年前Pascal时代28nm到14/16nm工艺的巨大工艺红利来说,这一代从16nm 到12nm 的提升幅度就没那么夸张,一定意义上来说,台积电以及三星的12nm工艺更多的是在之前14/16nm工艺基础上的小改成果 。
所以虽然有一定的效果,但对于NVIDIA来说并不会有太多频率和发热控制上的显著进步 。RTX6000采用的完整TU102核心拥有72个SM单元,而很不幸的是RTX2080Ti阉割掉了4个SM单元,仅有68组 。相应的内存控制器也阉割掉了一组,剩下11个,整体的策略和GTX 1080Ti时期对GP102的“刀法”完全一致 。
每一组SM单元中都配备了一个RT Core,以及两两成对的TENSOR Cores 。可以看出,事实上这一代FP32和INT32单元所占据的比例其实相对不那么高 。可以说这一代是近几年来,在底层变化最大的一代产品 。如果细化到Tensor Core本身,图灵架构的Tensor Core相对于Pascal上搭载的相同结构的最大变化就是将处理方式从2D平面升级到了3D,这意味着以数量级计的效率提升 。
GDRR6显存:求稳之举出乎很多人意料的是NVIDIA在这一代产品中并没有使用大家所期待的性能强大的HBM2显存 。继续使用了最新的DDR显存,也就是GDDR6显存 。架构上没有多少变化的GDDR6是基于前一代产品的继续优化产物,通过提升频率到7000MHz(等效14000MHz)将带宽提升到了14Gbps的水平,同时降低了40%的串扰 。
虽然性能仍然不可能与HBM相比,但胜在成本低,良率高,可以持续大规模供货,不至于出现被显存拖累的窘境 。前文我们说到,RT Cores占用了很大的核心面积,而这些单元并不会提升传统的光栅渲染效能 。他们的用途要比单独提升游戏的FPS值更有价值 。基于这些单元,NVIDIA在这一代显卡产品中加入了酝酿多年的“实时光线追踪”(RTX)技术 。
这也是为什么这一代显卡产品的命名从“GTX”变成“RTX”的原因 。光线追踪与实时光线追踪传统的光栅化渲染其实将一个3D图形的几何信息转变为一个个栅格组成的2D图像的过程,可以理解为在这个3D图形的每个点都包含有颜色、深度以及纹理数据,经过一系列计算变换后,将其转换为2D图像的像素,进而呈现在显示设备上 。
更多的是一种基于作者认为“这里应该有这个”的创作性质的图形渲染方式,一定以上来说就是已知结果并把结果写出来,而并不能知道这个结果是正确的还是错误的 。而光线追踪技术则是通过通过光源位置、射线、和物体关系进行真实的光线模拟运算,来得出这里应该有哪些光线,有怎样的反射关系 。这样得出的游戏画面的光影效果也就更加真实 。

推荐阅读