从处理器架构的角度看，为什么超威半导体（AMD）相对英特尔（Intel）的中央处理器表现高分低能？

要理解为什么在某些性能测试中，AMD 的处理器（CPU）“得分高但能耗也高”，我们需要深入探讨处理器架构的几个核心方面，并将其与英特尔的策略进行对比。这并非一个简单的“好坏”之分，而是两种不同的设计哲学和权衡的结果。

首先，我们得明确“得分高”和“低能”的语境。通常，“得分高”指的是在合成基准测试（如 Cinebench, Geekbench）或某些特定应用（如视频编辑、大型游戏中的CPU密集型场景）中，AMD 处理器能输出更高的峰值性能。而“低能”则指向在达到这些峰值性能时，其功耗（TDP Thermal Design Power，热设计功耗，虽然不是实际功耗，但常被用来衡量其功耗上限）和实际功耗也相对较高。

AMD 的高能表现及其背后的架构逻辑：

AMD 近年来的崛起，很大程度上得益于其 Zen 架构的颠覆性设计，特别是 Chiplet（小芯片）设计和核心数量的激进增加。

1. Chiplet 设计与核心数量的优势：
定义：传统的处理器设计是将所有核心、缓存、内存控制器等都集成在一块大型的硅片上（Monolithic Design）。而 Chiplet 设计则是将一个完整的处理器分解成多个独立的小型芯片（称为 Chiplet），这些 Chiplet 再通过高速互联技术（如 AMD 的 Infinity Fabric）组合在一起形成一个完整的处理器。
核心优势：
成本效益和良率：制造大面积的单片硅成本高昂，良率也较低。将处理器分解成小 Chiplet，即使某个 Chiplet 有缺陷，也不会影响整个处理器报废，从而大幅提高生产良率和降低成本。
更易于扩展核心数量：在 Chiplet 设计下，AMD 可以非常容易地将多个 CPU Chiplet（包含多个核心）与一个 I/O Chiplet（包含内存控制器、PCIe 控制器等）组合，从而快速推出拥有极多核心数量的处理器型号。这在多线程应用中具有显著优势，能够实现“堆核”式的性能提升。
设计灵活性：可以混合搭配不同制造工艺的 Chiplet，或者为特定需求（如更强的核显）定制 Chiplet，增强了设计的灵活性。
对性能的影响：更多的核心直接意味着在能够充分利用多线程的应用中，AMD 处理器可以并行处理更多任务，从而在这些测试场景下获得更高的分数。例如，在渲染、编译、科学计算等领域，核心数量的优势尤为明显。

2. 高主频与大缓存的策略：
AMD 在其 Zen 架构中也注重提升单核性能，通常会通过更高的基础频率和加速频率来达成。同时，通过更大的 L3 缓存来减少访问内存的延迟，进一步提升了处理器的响应速度和整体吞吐量。
对性能的影响：高主频和充足的缓存是提升单核和多核性能的直接因素。当这些核心被充分激活时，自然能输出更高的性能。

AMD 的高能耗表现及其原因：

高分数背后，往往伴随着更高的资源消耗，尤其是在电力方面。

1. 驱动更多核心和更高频率的必然代价：
核心数量增加：即使每个核心的功耗相对优化，但当处理器集成数十个甚至一百个核心时，总功耗自然会大幅攀升。为了驱动如此庞大的核心数量，处理器需要更高的电压和更长的运行时间，这直接导致了功耗的上升。
高主频：提高处理器频率与功耗之间存在着一个大致的指数关系（功耗 ≈ C V^2 f，其中 C 是电容，V 是电压，f 是频率）。为了达到更高的加速频率，处理器可能需要提升电压，从而导致功耗的急剧增加。AMD 在追求峰值性能时，往往会允许处理器在短时间内或在需要时运行在更高的频率和电压下。

2. Chiplet 互联的功耗：
虽然 Chiplet 设计在制造上具有优势，但这些分散的 Chiplet 之间需要通过高速互联（如 Infinity Fabric）进行通信。这些互联总线本身就需要消耗一定的电力来维持信号的传输和同步。相较于集成在一块硅片上的设计，Chiplet 之间的通信可能需要更复杂的信号处理和更多的能量。

3. AMD 的性能调校哲学：
在产品定位上，AMD 倾向于在同代产品中提供更强的绝对性能上限，尤其是在“高性能计算”领域。这意味着其在设计和调校时，会更侧重于释放处理器的最大潜能，而不是将功耗控制作为首要目标。换句话说，它们会允许处理器在需要时“尽情发挥”，即使这意味着更高的功耗。这与某些对能耗非常敏感的特定市场（如超薄笔记本）的英特尔处理器定位有所不同。

英特尔的策略及其差异：

英特尔在处理器设计上，长期以来更倾向于单片集成设计 (Monolithic Design)，并且在性能与功耗的权衡上有着更为精细的调校。

1. 单片集成设计的优势与劣势：
优势：各个组件之间的通信延迟更低，集成度高，理论上可以更高效地管理功耗。在相同制造工艺下，可以设计出更紧凑且功耗控制得当的产品。
劣势：制造良率随芯片面积增大而下降，成本高昂，难以像 Chiplet 那样轻易地堆叠大量核心。

2. 英特尔的性能调校哲学：
英特尔在性能调校上，更倾向于在“性能”和“功耗/发热”之间找到一个更为平稳的平衡点。在许多场景下，它们会通过更先进的制程工艺（在同代对比时）和指令集效率的提升来达成性能。它们也在积极采用大小核混合架构 (Hybrid Architecture)，如 Alder Lake 及更新的酷睿处理器，通过低功耗的 Ecores (Efficientcores) 来处理后台任务和低负载场景，以降低整体功耗，而将高能效的 Pcores (Performancecores) 用于需要高算力的任务。
对性能的影响：在单核性能或轻度多核负载下，英特尔的 Pcores 表现依然非常出色。但在重度多核负载且需要持续高输出的场景下，其核心数量的限制（相较于AMD）和为了功耗控制而可能限制的最高频率，使得其在某些“极限性能”测试中会输给AMD。

总结：AMD 的“高分低能”与其架构策略的关系

架构核心：Chiplet 设计与大规模多核化是 AMD 处理器在多线程应用中取得高分的直接原因。这使得 AMD 能以相对可控的成本推出拥有极多核心的产品，并快速迭代。
性能释放策略：追求绝对性能上限导致了在驱动这些核心和维持高频率时，功耗必然会升高。这是一种“以能量换性能”的策略，在对绝对性能有需求的市场（如高端台式机、工作站）中非常有效。
对比英特尔：英特尔在追求性能的同时，更强调功耗与性能的平衡，并利用大小核混合设计和工艺优势来优化整体效率。因此，在需要极致多核性能的场景下，AMD 的堆核策略更容易取得“高分”，而其功耗表现也相对“不那么低”。

所以，当人们说 AMD “高分低能”时，实际上是在描述一种特定情境下的性能功耗比，并且是对比英特尔在不同架构设计和策略下的表现。AMD 的优势在于其强大的多线程处理能力和更高的性能上限，而其劣势则体现在同等或更低性能水平下，其功耗可能更高。这两种策略各有优劣，满足了不同市场和用户群体的需求。

网友意见

没有高分低能的硬件，只有选错了跑分和对应场景的关系的人

首先我用AIDA64的性能基准来说明一下

你能看出谁高分低能吗？你会发现CPU QUEEN/zlib是同规格下AMD与Intel接近，AES/Hash是AMD明显绝对优势，VP8是多核没什么优势/超线程负加成+Intel高主频处理器有优势，julia/mandel/ray trace FP32/64是Intel绝对优势，Sinjulia是AMD有较大优势，CPU PhotoWorxx是Intel优势且超线程有负加成，至少从AIDA64这些项目来看，你不能说谁高分低能，那这些差异是为什么呢？

这样一看很多人似乎理解了，Intel有优势的项目全是AVX/AVX512项目，AMD最大优势Hash，AMD处理器都支持Hash加速指令，且拥有更大的加密解密执行单元，而FPU中Sinjulia是AMD的优势项目，而恰好80bit扩展精度的浮点计算无法使用SIMD指令进行优化，他使用了更老的X87浮点指令和执行单元来执行

那有人要问了，这难道是指令集的问题导致了差异？其实指令集只是汇编语句的抽象概念，只是告诉处理器该怎样执行这些计算的一个显式的概念，对应的背后是具体使用了何种单元执行这些指令，处理器如何更快的将这些指令发射到对应的流水线来执行的问题。比如Ryzen都支持AVX2指令，但观察9700K/9900K相对2700X，同样是8核规格，在AVX项目上2700X都被拉开极大差距，这便主要是执行单元的巨大差异造成的

Zen与Skylake系列的后端执行单元来看，AMD的端口多达10个，除去两个AGU，实际执行计算的端口有8个，Skylake则只有4个，其中VEC是执行SIMD指令的单元，它将负责AVX/SSE的指令执行，AMD则是整数浮点分离，整数4个端口，浮点4个端口，咋一看AMD没有任何劣势啊，Intel在执行浮点加法乘法将使用Port0/1的FMA单元提供的乘加计算，该单元在乘法加法混合时如果有FMA指令则同时双发乘加融合计算，即执行浮点加法时双发射，浮点乘法时双发射，乘法加法同时混合使用FMA单元的FMA计算，也是双发射（等效4发射），AMD的浮点计算则没有专用FMA单元，所以执行浮点加法是双发射，乘法是双发射，乘加融合是两个Mul+两个Add一起上，相当于四发射，咋一看还是没差别啊？但AMD不幸的是每个单元只能执行128Bit SIMD的计算，Intel则是256/512Bit（Skylake-X）的SIMD计算，这样同样是双发射，Intel是2X256，AMD是2X128，自然也就被远远甩开，

而整数计算Intel的SIMD int加法依旧是VEC的单元来做，他是3个ALU来做int型的逻辑和int加法计算，所以最高吞吐3X256，int乘法则属于FMA单元的事情，他能实现2X256的吞吐，AMD的int型逻辑计算由4个ALU执行实现4X128吞吐，int加法由其中两个ALU执行，实现2X128，乘法由其中一个ALU执行实现1X128，最后一个ALU执行除法，包括Intel都是一个除法器，当然除法器Intel的移位规模很高，实现了radix 1024，这也使得其在老式圆周率计算super Pi中领先AMD相当多，总结如下

当然之前AMD没能力做，一堆A粉想尽办法掩饰，比如AVX没用（没用你还明明用着128bit SSE指令集的宽度来支持AVX2），比如AMD考虑市场上支持AVX的少节约成本（这时不谈挤牙膏了，不给你是为了节约成本），然而Zen2就要把这个执行单元升级为256Bit了，显然之前的规模和工艺，AMD自身能力的不足，难以在14nm就像Intel一样设计一个这么大的计算单元还跑出高频（Intel），体现了双方的差距

但是，AMD不是也有优势项目吗？比如Sinjulia，比如AES Hash跑分就很牛逼啊，CPU queen也不差啊，而且如果执行128bit的SIMD，你Intel不也是2X128的水平？这样不就差不多了？

这就是另一个问题，比如CPU QUEEN是一个棋盘皇后（10皇后）问题，他指的是在10X10的棋盘上摆放10个皇后且不能相互攻击（皇后是横竖加对角都能攻击的），这个问题被认为是分支处理的典型问题，这在日常中不是不常见，然而这里有一个巨大的问题，那就是AIDA64的棋盘皇后问题做了多线程的处理，而且由于基本不具备向量化并行优化空间，这几乎对AMDIntel来说就是个谁核多线程多谁厉害的项目，然而日常中这并不是一个简单的事情，更多时候一些分支的处理往往都还是单线程的，这让超多核的处理器实际上就出现了AIDA64跑分高但日常用不到的问题，同理，aida64上的AVX512项目，也面临日常用不到的境地，但好歹AVX512可以在密集计算领域发挥作用，密集计算的需求在如今越发旺盛，CPU强化这方面性能显然是对抗GPU的一个重要手段，在日常中可能就不能转化为你能看见的能了

Sinjulia代表的X87浮点更是如MMX一样，基本是历史垃圾堆里的了，属于基本只有古董软件才有，但是古董软件也压根很难支持你这么多核，这也是AMD很多时候跑分高的原因，使用老版本的跑分软件，在标量执行单元和流水线设计如今趋同的今天，基本的ILP优化水平都差不多的，能同频差出10%已经很多了，所以AMD多两个核跑分想低都难，但是实际应用中这些老版本的跑分软件对应的使用场景也很难有足够多的线程调用，这也让AMD的多核性能不太容易在日常使用中发挥出来，好不容易有足够多的线程支持的软件，你发现他居然支持了AVX，虽然AVX的利用率也没有支持AVX的跑分软件那么高，但是这么一来一回，Intel本身同频性能和主频也高，依旧也就保持了优势

而既没有FMA指令支持的SSE程序，使用128bit SIMD和寄存器的程序，AMD自然是与Intel五五开，如果你的使用环境的确是这样，那AMD也不是低能，但是还是要考虑多线程的支持程度，否则如果即使Intel核更少，但是你的程序连4核都利用不上，那在如今主流处理器都已经4核以上的时候，大家都只跑4个核，那主频更高更有优势

当然服务器讲求多实例的吞吐能力，比如单个实例单个任务无法利用足够多的线程，但可以同时执行多个实例来充分利用这些线程，这样也就发挥了多核的作用，但是问题在于家用用户很难有足够多的并发项目来填满超多核心处理器，往往普通用户处理的是单个实例或较少实例的负载，而且核心多使用多个实例来填满硬件线程，还会面临极高的内存速率和容量需求

使用SPEC2006浮点Rate项目+新编译器环境下（VS2017+ICC19）对9900X/9940X/7820X/金牌6144进行了对比（SPEC2006在编译器使用Qxcore AVX512的收益有限，所以我做9900/9940的时候直接使用QxCORE-AVX2）

7820X 16线程，我设定了16个实例（Rate 16）来执行，安装48GB内存，每个实例分到3GB内存

9900X 20线程，我设定了20个实例（Rate 20）来执行，安装64GB内存，每个实例分到3.2GB内存

9900X 28线程，我设定了28个实例（Rate 28）来执行，安装64GB内存，每个实例分到2.3GB内存

双路金牌6144共32线程，设定32个实例（Rate 32）来执行，安装192GB内存，每个实例分到6GB内存，同时每个实例分到的L3是6144最多（6144一共49.5MB L3），其次是9900X（19.25MB L3），然后是9940X 19.25MB L3但是28个实例。7820X是11MB L3 16实例，这些处理器的多核频率都比较接近

实际上可以发现很多项目9940X的内存瓶颈极大，尽管他比9900X多了40%的核心，频率也相近，但是有不少memory bound项目已经被9900X追上，而6144凭借超大的缓存和内存容量，基本放飞自我，只有少数内存瓶颈小的项目被9940X追上，这说明在讲求多实例的吞吐测试中，尽管有能力填满所有核心与线程了，但此时内存性能也成为一个重要指标，他会明显影响性能的表现

至于AES和Hash，日常主要用于签名，身份验证，包括网页，下载文件的校验，如果要执行密集的AES/Hash计算，可能比较为人熟知的应用就是挖矿了，比如比特币是SHA，门罗币是AES，而且最重要的是Hash虽然intel没给主流处理器支持SHA（尽管SHA指令集极其加速单元是Intel扩展的，被用于目前的凌动处理器），但是实际上可以通过AVX512 int单元来执行HASH，实际上sisoftware给出的成绩便是AES计算成了cache/memory bound，Hash使用AVX512配合高内存带宽配置，实际上Intel完全不输AMD

我直接拿我跑的9940X（全默认）与sisoftware的2990WX进行了对比，实际上跑分完全不输，不仅是加密解密不输，其实像诸如多媒体（SIMD），科学计算等项目14核9940X依旧超过了2990WX，，说AMD高分可以停停了

实际上只要还在2018年继续更新的跑分软件，都显示AMD的优势越来越小，因为AVX/AVX512的支持越来越普遍，就连AMD最爱的CPUZ跑分，都在近日支持了AVX/AVX512，还有3Dmark的新场景，就连刺客信条奥德赛还搞出了不支持AVX不能进游戏的问题

在都是默认频率的成绩下，2700X拿9700K来打都是浪费，当然SSE的分数还是很高的，比7820X还高，可能这也是有人认为AMD高分的原因

而AMD市场宣传最爱的R15，的确也是高分

可问题是，我拿出R20跑了一下R15里面的渲染场景，仅仅只是重新导入了这个项目，其他没有任何修改，

7820X 9秒完成，而使用R15足足掐着秒表要20多秒，请问R15有什么资格代表C4D的性能指标？

C4D更是支持了embree插件，而embree插件最新的支持AVX512，未来C4D的新版随之支持也是理所应当的，而3DsMax，Conroa都有使用embree插件用于光线追踪和特效处理的部分，这也是为什么很多人发现AMD跑R15很厉害，R15出的时候本身压根没有任何AVX支持，使用的embree插件也是古董级的，但是跑实际自己用的新版本甚至8核不比8700K快的问题

上图则是blender最新的编译测试版运行一个光线较多的渲染的一个性能分析器结果，可以发现AVX FMA的使用已经成为了主要SIMD部分，256bit向量占据了更高的比例，再拿什么avx用不到来说已经毫无意义，更不要说Intel已经在研究X265使用AVX512的问题了

最后便是很多人说的优化问题，首先Intel的软件开发中心有数不清的优化参考文件，而AMD的寥寥无几也很难找到，似乎AMD认为反正我和Intel都是X86处理器，你优化好Intel我就能跑的态度，Intel针对新处理器的parallel Studio XE套件，涵盖计算需要的MKL IPP DAAL ICC编译器等工具，能无缝安装进入VS，AS，eclipse，Xcode等多个平台的IDE，反观AMD，出个AOCC，厉害就厉害在只能在Linux上用，而且参考资料少

而且Intel尽管被嘲讽icelake看不到在哪，但是AIDA64的更新页面一打开，你会发现ICL将会提供用于使用256bit向量加速的AES指令集VAES已经被AIDA64性能测试进行优化了，cascadelake的优化也存在了，而已经被AMD发布的Zen2，看不到优化迹象，甚至sisoftware也提供了对ICL VAES的支持，

你以为是跑分软件故意优化Intel不优化AMD？打开ICC编译器的属性选项，你会发现未来架构的处理器都在优化范围内，AMD推出AOCC For ryzen甚至要等到zen上市以后

对比之下，AMD属于活该优化不好，当然日常中的低能，无非就是AMD游戏性能不好，这主要是游戏对内存延迟的要求，对主频的要求高，至于多线程优化？你可以这么理解，等什么时候游戏能支持足够多线程的并行计算了，AVX512可能也在游戏里跑了，到时低能不低能和跑分有什么关系？

类似的话题

从处理器架构的角度看，为什么超威半导体（AMD）相对英特尔（Intel）的中央处理器表现高分低能？

要理解为什么在某些性能测试中，AMD 的处理器（CPU）“得分高但能耗也高”，我们需要深入探讨处理器架构的几个核心方面，并将其与英特尔的策略进行对比。这并非一个简单的“好坏”之分，而是两种不同的设计哲学和权衡的结果。首先，我们得明确“得分高”和“低能”的语境。通常，“得分高”指的是在合成基准测试（如.............
在 5G 覆盖后，是否可以将处理器从手机上撤掉？

这是一个很有意思的设想，但也确实非常不切实际，甚至可以说是“脑洞大开”了。简单来说，不行，绝对不行。哪怕是5G信号满格，手机的核心处理功能也必须留在手机内部。让我来仔细跟你掰扯掰扯，为什么即使有5G，处理器也不能随便扔掉：1. 5G 传输的是什么？是“路”，不是“脑子”。首先，我们需要明白5G的作.............
单从处理国政上说，明宪宗到底昏君还是明君？

论明宪宗朱见深，在治国理政这一个维度上，评价他是“昏君”还是“明君”，的确是个复杂且见仁见智的问题。若单刀直入，抛开其他因素，仅从他处理国政的实际表现来看，我认为他更倾向于一位带有显著局限性的守成之君，而非英明果断的开创之主，其统治中“昏”的成分在某些关键方面尤为突出。要说清楚这一点，我们得一件件.............
如何处理不小心从野外带回家中的蜱虫?

处理不小心从野外带回家中的蜱虫，需要谨慎、快速、彻底，以避免可能的健康风险。以下是详细的步骤和注意事项：核心原则：快速行动：蜱虫一旦附着在皮肤上，就会开始吸血并可能传播疾病，因此尽快移除至关重要。安全操作：使用合适的工具，避免直接用手接触蜱虫，防止其分泌物进入眼睛或伤口。彻底清.............
从加湿器的出风口加进水如何处理？

.......
从电水壶往外倒水,水顺着壶嘴往下漏，怎么处理？

.......
加湿器从出雾气口加水了怎样处理

.......
从老家寄电磁炉，电磁炉面板运输中压破了，20多天了怎么说都不给我处理，这个打消费者投诉电话可以吗？

.......
从鼻头黑色毛孔里挤出白色和黄色大蚂蚁大小的条状物，是什么啊，怎么把鼻头处理干净？

.......
今天突然从瓷砖缝隙出来很多带翅膀的蚂蚁怎么处理，怎么防治

.......
用商品房从银行贷款20万，还清后，房主去世了，这种情况该如何处理？

您好！关于您提出的“用商品房抵押贷款20万，还清后房主去世了，该如何处理”的问题，我将为您详细解答，并尽量以清晰、易懂的方式呈现。首先，要明确一个核心事实：贷款已经还清，房屋的抵押权就已经消除了。银行当初为这笔贷款设定的抵押权，是为了保障其债权。一旦债权（20万贷款本息）通过您的偿还而消失，抵押权.............
该如何妥善的处理认知层面与你相差甚远的十几年从无来往的同学的不合理请求？

嘿，收到你的问题，关于如何处理和那种好久不见、而且认知差距挺大的同学之间的不合理请求，我完全能理解。这种事儿确实有点棘手，毕竟时间过去这么久，你们的路已经完全不同了。别担心，我给你梳理梳理，尽量说得细致点，让你觉得不是那种冷冰冰的 AI 回答。咱们先冷静分析一下情况。你提到的“认知层面相差甚远”和“.............
全职妈妈从怀孕到带孩子到一岁半，老公认为我花销太大，怎样处理这种情况？

看着宝宝熟睡的小脸，你内心五味杂陈。一边是身为全职妈妈的满足和骄傲，另一边却是老公那句“花销太大”的指责，像一根刺一样扎在心头。从怀孕的孕期营养补充、产检、到宝宝出生后的奶粉、尿布、衣物、玩具，再到你自己的身体恢复、营养品，这些支出确实不少。但你为这个家付出的，是青春、是精力，是完全属于你的时间和空.............
我的烤箱从上部的透风孔进水了，会坏么？？怎么处理？就是水杯在上面翻到了。

.......
离职后，老东家一直给我打工资，从法律角度讲，该如何处理？

这情况确实挺让人头疼的。从法律角度来看，您老东家持续给您打工资，这在很多情况下是属于不当得利。简单来说，就是对方在您已经离职，不再提供劳动的情况下，依然将本应属于您的劳动报酬支付给您，但您已经不再具备获得该报酬的合法基础。下面我来详细说说这事该怎么处理，以及背后的法律逻辑：1. 为什么会出现这种情况.............
蟑螂爬过的地方有毒吗怎么样处理它爬的地方，大半夜发现只蟑螂从我床

.......
亚都加湿器yc-e350因误操作从上面加水导致有风没雾怎么处理？

.......
父亲把当年给我作陪嫁的传家宝从我家偷走，送给弟媳，我该如何处理？

这事儿，搁谁身上都得心梗。辛辛苦苦攒下的陪嫁，那可是我自己的东西，更是家族里的念想，结果被我亲爹，我妈听了也得掉眼泪，就这样悄无声息地从我这儿“搬”走了，还送给了弟媳妇？这事儿，别提多让人窝火和寒心了。首先，你得冷静。我知道现在心里肯定是一团乱麻，各种情绪在翻腾，但是越是这个时候，越不能冲动。冲动只.............
房子里出现的有蚂蚁洞不知道怎么处理像这种情况把这口封住蚂蚁还会从别的地方出来吗？怎

.......
有谁用过洗鼻壶，使水从鼻子里进入耳朵的，请教，怎么处理，谢谢

.......