一个朋友买了个MSI GTX 950 2GD5T显卡用于圣诞节。

我说:“是的,现在的显卡非常快,每秒可以处理20亿个三角形。”然后,我尝试进行检查以检查它是否在正确的范围内,但是我找不到该卡的“每秒三角数”统计信息,实际上无法找到许多卡。 “每秒三角形数”是否还有意义?如果是这样,这张卡的大概数量是多少? (除非另有平均条件)

评论

“流程”非常模糊。那是顶点着色器操作吗?评价者?底纹?上述所有的?这些都不是有意义的,因为它们对场景的依赖性很大。 FLOPS更好一些,但仍然不理想,因为它没有考虑寄存器压力,内存延迟等。

我了解所有这些因素。尽管如此,我还是想知道假设各种因素(简单/默认的顶点和像素着色器,简单的照明,大模型由一些合理的纹理表进行纹理化)假设适当/合理/典型选择时,每秒可以绘制多少个三角形)。

#1 楼

是的,这是一个有意义的统计数据:GPU具有专用的三角形设置硬件,并且速率以三角形/ GPU时钟来衡量。根据NV网站上的白皮书,680(Kepler)可以每隔一个时钟每SM发出一个三角形-带有8个SM,每时钟产生4个三角形。麦克斯韦(Maxwell)白皮书并未指出每SM的速率变化-980有16个SM,因此,如果每SM确实没有速率变化,它可以产生8个三角形/时钟。 980具有2048个CUDA内核,而950具有768,意味着6个SM和3个三角形/时钟。该芯片的运行频率约为1 GHz,因此950每秒可能限制为30亿个三角形。

评论


$ \ begingroup $
现代卡与上一代卡的不同之处在于,它们不再具有用于三角形的固定管道,因此在卡外条件下提防时,很难说出速率是多少。
$ \ endgroup $
– joojaa
16年1月20日在6:22

$ \ begingroup $
我担心NV可能会遇到这种情况。 AMD在夏威夷确实有一个固定的三角形设置引擎,但是如果它在下一个体系结构修订版中消失,我不会感到惊讶。
$ \ endgroup $
–丹尼尔·格塞尔(Daniel M Gessel)
16年1月20日在6:39

$ \ begingroup $
同样,在我看来,您可以做出某些默认假设,以比较“卡外”的不确定性,以比较卡速度(简单/默认顶点和像素着色器,简单照明,大模型由一些合理的纹理表进行纹理处理)。但是,我认为固定管道每秒20亿的估算值与您在这些假设下获得的估算值相似。谢谢。
$ \ endgroup $
– M Katz
16年1月21日,下午1:26

$ \ begingroup $
我将研究NV的白皮书-我需要了解它们的体系结构(几年前我在AMD工作)。理想情况下,会有综合基准可以帮助每个人了解瓶颈在哪里,但是对它们作弊已有很长的历史...
$ \ endgroup $
–丹尼尔·格塞尔(Daniel M Gessel)
16年1月21日,下午3:31

$ \ begingroup $
如果需要始终(或几乎总是)执行某项操作(而三角形设置就是其中之一),那么使用专用硬件可能会带来大量功率/面积/效率方面的原因。
$ \ endgroup $
–西蒙F
16年1月21日在10:31