这个两方面原因。
第一个原因楼上 @pansz 说了,显卡的运算单元多。以nVIDIA的20系显卡为例,甜点级的2060就有1920个运算单元,旗舰级的2080Ti更是高达4352个。做为对比,Intel支持AVX512的至强 W-3175,一共有28个核心,每个核心有两个AVX512单元,每个单元一条指令可以处理512÷32=16个单精度浮点数,单个CPU等同于16×2×28=896个显卡的运算单元,不到2060的一半。AMD的3990X是64个核心,但只支持256位的AVX2指令,单个CPU等同于256÷32×2×64=1024个显卡运算单元,刚比2060一半多点,但还是不到2060 Super的2176个运算单元的一半。
但这是指单精度浮点的通用运算能力,题目问的是图形化能力,这就要提到第二个原因了。
第二个原因是显卡有专用的光栅单元。三维模式要转换为我们显示器的像素显示出来,必须要先做光栅化(Rasterization)运算。这个网上有很多文章介绍,这里就不重复了,例如这篇:
一个多边形转换需要进行数次甚至十数次通用计算,而一个场景往往有多达数十上百万个多边形,没有专用指令的CPU处理起来自然很慢。显卡有专用的光栅单元(ROP,Render OutPut unit),一次转换只需要一个时钟周期。而且显卡通常有几十甚至上百个ROP,例如2060就有48个ROP,2080Ti是88个。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有