百科问答小站 logo
百科问答小站 font logo



CPU(为方便讨论,这里仅限32位X86指令)的各种构架,比如奔3,奔4,对纯加法运算速度有帮助吗? 第1页

  

user avatar   bei-ji-85 网友的相关建议: 
      

不同CPU硬件架构的情况下,指令效率可能是不一样的,具体可以参考这个链接:agner.org/optimize/inst

我查了一下手册,Pentium3和Pentium4对于整数的加法指令(假设参数都是寄存器:ADD r,r),那么性能上最大都是一个时钟最多两条指令,这一点性能是一样,但如果跟后来的sandybridge这些架构的CPU比,性能还是不一样的,Pentium3和Pentium4的加法只能使用p0/1两个port,但在sandybridge里,ADD指令可以用p0/1/5三个port,理论上说,一个时钟里可以执行三条ADD指令。

AMD的资料相对更容易看一些,比如Ryzen架构下ADD在一个时钟周期内最多可以并发4个,在K7架构下最多只能并发3个。

当然,以上只是CPU层面的理论值,实际使用中,未必就能真的达到上述效果。但结论是肯定的,CPU架构在升级的过程中,指令的执行速度确实是有可能变快的。

另外,缓存、流水线等设计的变化也会影响指令的速度。

另外,累加求和在汇编层面上,可以写成这样:

       INC EAX ADD EBX,EAX CMP EAX, 1000000 JNZ XXXX     

指令依赖性方面,只依赖第一条指令,后两个指令是可以并发的(丢弃ADD的标志位信息),不同架构的CPU能处理的并发条件不同,理论上讲,新的架构并发执行的效果更好。




  

相关话题

  如何看待鸿蒙操作系统「正式」发布? 
  指令前缀0x66到底是干什么用的? 
  如果现在携带一颗英特尔 12 代酷睿 i9 12900k 回到 20 年前,会对人类科技带来多大影响? 
  微软宣布 Windows 11 全部免费升级,还有哪些值得关注的信息? 
  图形方面的函数的参数为什么多用浮点? 
  如何看待“【铁流观点】中晟宏芯CPU引进IBM技术能复制高铁模式么”? 
  如果中国被美国禁止使用 Android、iOS、Windows 系统,会对中国造成怎样的影响? 
  中央处理器(CPU)内部电路连起来有多长? 
  为什么英特尔x86等多数中央处理器不支持源操作数和目标操作数同时为内存的指令? 
  锐龙 6000 系列和 Intel 12 代的 CPU 性能有多大差异,哪个更强? 

前一个讨论
程序在地址空间中的位置是何时,以及如何决定的?
下一个讨论
北京大兴区的发展好不好?如果不好,为什么?





© 2024-05-17 - tinynew.org. All Rights Reserved.
© 2024-05-17 - tinynew.org. 保留所有权利