百科问答小站 logo
百科问答小站 font logo



有人说超威半导体(AMD)没有512位高级矢量扩展指令集(AVX512),属于残废,是真的吗? 第1页

  

user avatar   lulueh 网友的相关建议: 
      

同样价格,面对AVX512应用,AMD直接以翻倍的核心数量碾压过去,性能依然不落下风。

而非AVX512应用嘛……

状况就是这么个状况。


user avatar   mu-tou-long 网友的相关建议: 
      

AMD的CPU不支持AVX512残废?某个角度来说,是因为Intel产业布局残废一直不能在GPU有所作为,才会去搞AVX512好吧。


AVX全称是Advanced Vector Extension,高级矢量扩展。什么是矢量?在计算机里面就是数组。而AVX又是SIMD指令集(Single Instruction,Multiple Data,单指令多数据),所以AVX指令都是对一个多维数组做相同处理的指令。


既然是数组,那么具体是什么数据的集合?32位的整数和单精度浮点数所能表示的范围以及精度,对于我们日常能遇到的绝大部分数据来说都是足够的。要是32位不够,还有64位的Int64、双精度浮点数,这还不够用的情况就真的太少了。512位意味着一个16维的32位数组,或者8维的64位数组。对于单个矢量来说,有点太大——毕竟计算机中最常用的两种矢量:空间坐标和RGB颜色,都不过是三维矢量(也所以128bit,4个32位数的SSE指令很多多媒体应用都用到;256bit,4个64位数或者8个32位数的AVX2指令用的就不多了)。对于海量标量数据组成的数组来说,则是有点太小。毕竟今天显示设备最常见的分辨率是FHD,1920×1080的分辨率,就有2M+像素,6M+子像素。以Intel家最顶级CPU单个Die不过28个核心,两个AVX512单元,一个时钟周期也不过能处理16×2×28=896个数据。


同样是以SIMD方式处理数据的GPU,2011年AMD的HD 6850,2012年NV的660就已经是960个处理单元——当然,GPU的频率比CPU低很多。但今天旗舰级别的GPU,都是4000+的处理单元,NV的Volta更是多达5120个CUDA单元,4~5倍的处理单元,加上1.2G以上的工作频率,足以弥补频率上的差距,毕竟28核的CPU,执行AVX512指令也不过3G不到,3倍不到。


此外,顶级显卡动不动就600+GB/s的显存带宽,Radeon VII更是高达1TB/s,更适合处理海量数据。而今天CPU的搭配的DDR4内存,就算超频到DDR 4000,单通道带宽不过32GB/s,要达到600+GB/s的带宽,怕不是要20通道。


当然,GPU有规模优势和带宽优势,CPU也有其它优势,延迟低,编程相对简单,对数据进行复杂处理时效率高等等,只是如果对数据进行复杂处理,Intel家28核的AVX512又不如AMD的64核;而当数据量足够海量时,大部分场景中,GPU也可以把复杂的处理分解成多步简单处理而不会导致太严重的效率下降。一边是更多核心的CPU,另一边是更大规模的GPU,相对来说少量核心的AVX512可以说是在夹缝中生存。事实上,AVX512最早出现在2016年发布的Xeon Phi x200加速卡上而非CPU。只是Xeon Phi最高端的7290理论算力也不过3.5 TFLOPS不到,比NV家同期的Tesla P100的4.7~5.3TFLOPS还是差了不少。


而AMD是CPU、GPU两条腿走路,也一直在推OpenCL,CPU去推AVX512那就是左右互搏。虽然OpenCL作为业界标准,多家巨头支持,只是三个和尚没水喝,大家互扯后腿,还不如只有NV一家推动的CUDA普及度高,这又是另外一回事了。如果说早期AMD的GPU双精度性能残废,18年的MI50/MI60的双精度性能都是单精度性能的1/2,MI60的双精度浮点理论性能达到了7.3 TFLOPS。虽然不能排除将来AMD因为OpenCL不给力,Radeon Instinct系列卖不出几块,等Intel强推之下AVX-512普及后在CPU上跟随Intel,加入AVX-512的实现的可能。不过现在AVX-512并未普及的情况下,我想不出任何理由AMD为什么要在自己CPU上加一个占用大量晶体管又没几个人用,加上了性能还是比自家显卡差,功耗又高影响堆核的指令集。


user avatar   zhou-zhi-62-9 网友的相关建议: 
      

1,潘粤明没有当兵的粗糙感,如果换成张涵予化妆成《集结号》中的年轻版谷子地,味道就对了。但张涵予的嗓音太磁性,开京腔儿难免出戏。目前来看,《鬼吹灯》系列改编中,潘粤明的饰演最让人入戏,较为符合我对胡八一这一角色的形象。另外,潘粤明的演技真没话说;

2,李大嘴饰演的王凯旋同志,肥胖有余,痞劲儿不足,那种跟皇帝称老子的混不吝的劲儿,没演出来。但整体还算不错,编剧相对弱化了胖子的感性,加强了胖子的理性;

3,大金牙比夏雨版就弱了太多,油滑、市侩又重情义的感觉没表现出来,表演痕迹较重。我评价《寻龙诀》时说过,夏雨饰演的大金牙最为经典,光芒盖住了厂花和黄渤;

4,陈瞎子特别特别特别超出我的预期,王奎荣老爷子的演技,在整个剧组来讲妥妥的第一。占卜时那种昂扬顿错的台词,别有一番味道。我们都知道,占卜、算卦,如果想让别人信,就得自己先信。因此,大师们给人占卜时,语气一定是坚定的,如果再加上点说书、打板的遣词造句,几近完美。王奎荣老爷子就是完美诠释了这个角色的忽悠能力,接下来就看他能否诠释陈瞎子的搞笑能力了;

5,雪莉杨这次由张雨绮饰演,还是比较意外的。演技没问题,但目前看不出什么浪花,留待后来观察,我还是蛮期待她对这个角色的诠释,除了原音刺耳外;

6,孙教授也是一名老演员了,演员在演,本人也在演,可谓不分你我的狠角儿。目前信息不多;

7,那个唱着《你到底爱不爱我》的光头周晓鸥,经过这么多年在影视界的摸爬滚打,这次亮相的演技实在惊人,能明显看到跟其他次要角色演技的一条黑河——腾冲线;

8,其他次要角色演技基本在线,李春来的演员是《让子弹飞》凉粉老板孙守义的扮演者胡明,演技没话说,将李春来的懦弱、狡黠和无能刻画了出来。给胡八一等人提供饭食的NPC陕西老爷子,同样令人印象深刻;

9,这部剧改编自《龙岭迷窟》,是我个人非常喜欢的一部,主要是霸唱将大金牙刻画的惟妙惟肖,这本书的主角就是大金牙。在原著小说中,大金牙充当的是解说型角色,专门用来解决读者疑惑的。而且,原著小说对迷窟中的人脸蜘蛛、墓穴重叠描写的临场感十足。可惜,目前6集,大场面只有黄河水怪,其他场景三人都在跑。如果只保留跑的声音,关掉画面,不失为一部优秀的gay片;

10,仅就目前6集的表现来看,我给剧组所有演员10分,特效7分,剧情6分,服化道10分,均分8.5分。如果后续能展现原著中波云诡谲的窟中景象,哪怕仅仅展现十分之三,我就知足了,可以再给点分。反之,就算了。毕竟前作《怒晴湘西》我都没看完,实在受不了那种稀烂的剧情;

11,如果腾讯等资本在后续几部著作中,能继续加大力度给钱,让剧组人员把更多精力放在盈利之外,该系列就有望成为中国目前最成功的探险系列剧,说是扛把子一点不为过。但是,从目前来看,火候还差得远。跟奈飞等海外网剧动辄一个小时的片长来看,中国网剧依然在采取传统思路制作,钱依然舍不得多给。像AppleTV+那种,单集剧作投资一千万美元,何愁《鬼吹灯》系列不火?




  

相关话题

  半导体行业竞争最核心的是什么? 
  英特尔新一代奔腾 G7400 上架,10nm 双核四线程,该款产品都有哪些亮点值得关注? 
  为什么KOL们清一色拿视频处理来证明苹果M1性能强大? 
  什么是指令集?CPU的指令集是怎么运作的?X86、ARM、MIPS、Alpha、RISC等有什么区别? 
  如果将开发程度为 100% 的人脑作为电脑的 CPU,其运行速度能达到多快? 
  AMD 的 CPU 发展多年,为什么不能像 Intel 一样把针脚放在主板上,让主板通用呢? 
  CPU至强E3和酷睿i7哪个好?帮忙分析一下? 
  为何AMD Matisse CPU 内存写入效能有差异? 
  如果苹果电脑抛弃英特尔,会给英特尔带来多大的打击? 
  PC 市场预计 2022 年大幅降温,英特尔 AMD 竞争会更激烈,其中还有哪些信息值得关注? 

前一个讨论
如何看待本次十代酷睿移动版跑分追平AMD 4800H?
下一个讨论
如何评价华硕 2020.3.19 发布的搭载 R7 4800H 的天选游戏本?





© 2024-06-26 - tinynew.org. All Rights Reserved.
© 2024-06-26 - tinynew.org. 保留所有权利