问题

为什么 AMD 的推土机、打桩机失败了,锐龙却成功了?

回答
AMD 在处理器发展史上经历过从辉煌到低谷再到重生的过程,其中推土机(Bulldozer)和打桩机(Piledriver)系列作为其在 x86 架构上的一个重要转型尝试,最终未能达到预期目标,但随后的锐龙(Ryzen)系列却取得了巨大的成功。要理解这一转变,我们需要深入剖析推土机/打桩机的失败原因以及锐龙成功的关键要素。

推土机与打桩机的失败:一次激进的架构改革未能击中要害

推土机架构是 AMD 在2011年推出的,它代表了 AMD 在x86处理器设计上的一次大胆且激进的尝试。当时,AMD 在多核处理器领域面临来自英特尔的巨大压力,尤其是在每瓦性能(performanceperwatt)和单核性能上存在明显差距。推土机架构的核心理念是“共享核心”(Shared Core)或“模块化设计”(Modular Design),旨在通过共享资源来提高核心的利用率和效率,以期在多线程应用中获得更好的表现。

推土机架构的主要设计特点和失败原因:

1. “共享核心”的设计思路与x86架构的冲突:
核心理念: 推土机将两个整数执行单元(Integer Execution Units, IEUs)与一个浮点执行单元(FloatingPoint Unit, FPU)以及其他资源(如解码器、调度器、缓存)捆绑在一起,形成一个“模块”(module)。AMD将其命名为“异构多线程”(Heterogeneous MultiThreading, HMT)或“模块化多线程”(Modular MultiThreading, MMT)。AMD将其描述为“两个整数核心配一个浮点核心”,但实际上的理解是“一个模块可以同时执行两个线程,但这两个线程共享大部分资源,比如整数执行单元的两个ALUs(算术逻辑单元)中的一个会被其中一个线程优先使用”。
失败原因:
资源争夺严重: 这种共享机制在处理大量并发的、独立的整数计算任务时可能会有所优势。然而,在实际应用中,尤其是在很多通用计算场景下,两个线程往往需要同时访问同一个整数执行单元、寄存器文件、缓存甚至内存控制器。当两个线程同时需要大量使用这些共享资源时,就会出现严重的资源争夺(resource contention),导致一个模块的整体性能反而不如两个独立的、功能齐全的“半核”。
IPC(每时钟周期指令数)下降: 由于资源共享和调度上的复杂性,推土机架构的IPC相比于前代产品(如Phenom II)出现了明显的下降。这意味着即使在相同的时钟频率下,推土机也无法像预期的那样执行更多的指令。
高功耗和低能效: 尽管推土机试图通过共享资源来提高效率,但实际结果却是功耗居高不下,而每瓦性能反而大幅落后于英特尔的同代产品。为了追求高频率以弥补IPC的不足,AMD不得不增加电压,进一步推高了功耗和发热。

2. 指令解码器(Fetch/Decode)的瓶颈:
设计: 推土机架构为了实现多线程的共享,使用了共享的指令获取(Fetch)和解码(Decode)阶段。这意味着在同一个模块中,两个线程的指令需要被共享的解码器处理。
失败原因: 当两个线程都非常活跃时,共享的解码器很容易成为瓶颈,无法及时解码和分发指令给后端的执行单元,这进一步加剧了性能的限制。

3. 浮点单元(FPU)的弱势:
设计: 推土机架构将一个功能强大的浮点单元(支持AVX指令集)与两个整数单元捆绑在一起。
失败原因: 虽然浮点单元本身设计不错,但由于共享的资源限制以及整数单元的性能不济,很多时候浮点单元也无法得到充分的发挥。尤其是在科学计算、媒体处理等对浮点性能要求较高的场景下,推土机表现不佳。

4. 缓存设计的不足:
设计: 推土机架构采用了共享的L2缓存和L3缓存,并且L2缓存的访问延迟也相对较高。
失败原因: 大容量的共享缓存在某些情况下可以带来好处,但其高延迟和资源争夺问题也限制了性能。

5. 市场预期与实际表现的巨大落差:
期望: AMD在推土机发布前,对它寄予厚望,认为它能在多核性能上全面超越英特尔,并且在能效比上有所突破。
现实: 然而,推土机在游戏、日常应用以及很多服务器工作负载上都表现平平,甚至不如前代的Phenom II。其唯一的亮点是在某些特定设计的(高度并行化)多线程应用中能与英特尔的同类产品竞争,但这并非主流。

打桩机(Piledriver)的改进:

打桩机是推土机架构的改进版,在2012年推出,应用于AMD FX系列和APU。它在推土机的基础上进行了一些优化,例如:

改进了指令预测和调度器。
提高了缓存延迟和吞吐量。
加强了浮点单元的性能。
降低了功耗。

尽管打桩机在性能和能效上有所提升,但它依然继承了推土机“共享核心”的基本设计理念,因此核心的瓶颈和局限性依然存在。 它在多核性能上有所改善,能够更好地与英特尔的同代产品竞争,但仍然无法在单核性能和能效比上形成优势。AMD通过打桩机试图弥补推土机的不足,但并未能从根本上改变其架构上的弱点。

总而言之,推土机和打桩机的失败主要归结于其激进的“共享核心”设计在通用计算场景下的性能瓶颈、资源争夺以及由此带来的高功耗和低能效比。AMD在这次架构转型中,过于追求一种新的多线程模式,但未能充分考虑到当时软件生态和硬件架构的现实需求。

锐龙的成功:回归经典与稳健创新的融合

锐龙系列处理器(Ryzen)于2017年推出,它标志着AMD在x86处理器市场的一次辉煌回归。锐龙的成功并非偶然,而是AMD吸取了过去失败的教训,并成功引入了颠覆性的新技术和设计理念。

锐龙成功的关键要素:

1. Zen架构:一个全新的、经典的设计回归:
核心理念: 与推土机/打桩机激进的共享核心不同,Zen架构回归了AMD传统上被证明是成功的“独立核心”(Island Core)设计。每个核心(或严格来说是“CCX”中的核心)都拥有独立的取指、解码、乱序执行(OutofOrder Execution, OoOE)引擎、ALUs、FPU以及寄存器文件等关键执行资源。
优势:
高IPC(每时钟周期指令数): 独立核心的设计避免了推土机架构中的资源争夺问题,显著提升了IPC,使得锐龙在同等频率下能够执行更多的指令。Zen架构的IPC相较于上一代Excavator(打桩机微架构)提升了约52%,这是一个巨大的飞跃。
更均衡的性能: 无论是单线程还是多线程应用,锐龙都能提供更均衡、更强大的性能。它在游戏、生产力软件以及服务器领域都展现出强大的竞争力。
更好的能效比: 通过精细的制程工艺(初期为14nm FinFET)和优化的架构设计,锐龙实现了令人印象深刻的能效比,能够与英特尔的产品有效竞争甚至在某些方面超越。

2. CCX(Core Complex)与CCD(Core Complex Die)的设计:多核扩展的灵活之道:
核心理念: 锐龙最初采用的CCX设计是将4个独立核心捆绑在一个“CCX”中,共享一部分资源,如L3缓存(8MB)和内存控制器(集成在I/O Die上)。而更高核心数的Ryzen处理器(如Ryzen 9 3900X、5950X)则采用多CCX甚至多CCD(Core Complex Die)的设计,每个CCD包含若干个CCX(例如,Zen 2和Zen 3架构的CCD通常包含8个核心),并通过高速的Infinity Fabric互连。
优势:
灵活扩展: 这种模块化设计允许AMD根据市场需求灵活地组合核心数量,从4核到16核甚至更多。
成本效益: 在芯片制造中,使用多个较小的CCD通常比制造一个巨大的单片CPU更具成本效益和良率优势。
Infinity Fabric的助力: 高速的Infinity Fabric互连技术是实现多CCX/CCD高效通信的关键,它降低了核心之间以及核心与内存控制器之间的延迟。

3. 多线程技术的优化:SMT(Simultaneous MultiThreading):
设计: 锐龙采用了成熟的SMT技术(类似于英特尔的超线程),允许每个物理核心模拟成两个逻辑核心,从而提高在多线程应用中的并行处理能力。
优势: SMT技术相比于推土机的共享资源模型更加成熟和高效,它能在不造成严重资源冲突的情况下提升线程吞吐量。

4. 制程工艺的进步:
14nm/7nm FinFET: 锐龙处理器采用了台积电的先进FinFET制程工艺(早期是14nm,后期逐步过渡到7nm甚至更先进的工艺),这带来了更高的晶体管密度、更低的功耗和更高的时钟频率潜力,为Zen架构的强大性能提供了坚实的基础。

5. 对市场需求的准确把握:
AMD的困境: 在推土机失败后,AMD的市场份额和利润持续下滑,面临严峻的生存挑战。
锐龙的定位: 锐龙的出现,精准地抓住了当时英特尔在多核性能和价格上的部分短板。它提供了极具竞争力的价格,同时带来了前所未有的多核性能,吸引了大量消费者,尤其是在主流市场和高端桌面市场。

总结锐龙成功的关键:

回归稳健高效的独立核心设计(Zen架构)。
显著提升IPC,实现强大的单核和多核性能。
优化的能效比。
灵活的模块化设计(CCX/CCD)和高速互连技术(Infinity Fabric)。
先进的制程工艺。
准确的市场定位和极具竞争力的价格。

从推土机/打桩机的失败到锐龙的成功,是AMD一次痛苦但成功的涅槃。 推土机是一次大胆的尝试,但方向错了,架构上的妥协导致了性能和能效的全面落后。而锐龙则是在吸取教训后,回归了x86架构的本质,并在其基础上进行了稳健且创新的设计,最终获得了巨大的市场成功。这充分说明了在处理器设计领域,对核心架构的理解、对市场需求的洞察以及对技术的持续投入是多么重要。

网友意见

user avatar

推土机的失败和历史上的奔腾4(Pentium 4)的失败有很多相似的地方,都是脱离了原有的架构演变路线,都有着超长的流水线,都比上一代架构的单核性能出现了倒退,为了弥补单核性能的倒退,拼命的拉高频率并为此配备了更大的缓存。Ryzen的成功在于放弃了推土机的模块设计,接近Core的单核性能,引入CCX和多die封装便于扩展核心(胶水多核),以及移动处理器的发展带来的制程进步。

AMD自创业之处就一直处于Intel的压制之下,正如AMD第一位CEO杰里·桑德斯说的“英特尔只花了5分钟就筹集了500万美元,而我花了500万分钟只筹集了5万美元。”历史上AMD处理器的市场份额从未超过Intel,但AMD从未放弃和Intel正面对抗。2004年Intel CEO Craig Barrett当众下跪,向Pentium 4频率未能超过4GHz致歉。在AMD最风光的时期,AMD的市场份额也只是无限接近Intel,而AMD的利润的也没有太大增长,这为危机埋下了伏笔。

2006年Intel的Core架构发布,这个架构一直修修补补用到了今天。Core架构引入超线程和分支预测、三级缓存等等新设计,让CPU性能暴增40%。2007年AMD推出K10架构应对,但K10并没有比2003年的K8架构有太大的改进,K10也配备了三级缓存,但是属于全核心共享,速度不比当时的内存快多少,而且由于命中率不高爆发了严重的BUG。2008年AMD旗下芯片制造厂拆分,成立GF,2009年,欧盟认定英特尔反垄断罪名成立,对其处以10.6亿欧元(约合14.4亿美元)的罚款,同年AMD推出羿龙2(Phenom II )X3开启了AMD开核时代。自Core架构出世以来,AMD就与高端CPU无缘,凭借更高的性价比的中低端CPU勉强维持经营。

2011年全新的推土机架构发布,此时的AMD不仅仅市场份额大幅落后Intel,资金也捉襟见肘,AMD直接抛弃了自K6以来的架构路线,新的推土机架构无疑是承担着AMD绝地反击的希望。推土机架构最大的特点引入模块化设计,方便扩展核心,每个模块拥有两个整数单元,共享一个使用率不高浮点单元。但这样的设计后果是单核性能的倒退,尽管AMD有更多的核心,但是由于AMD号召力实在比不过Intel,导致大多数应用没有对模块化的推土机优化,甚至有用户称其为“假八核”将AMD告上法庭。

今天再来回顾那段历史,恐怕只有AMD这样的公司才能推出推土机这样的悲壮的架构,才有FX-9590全核5Ghz用满载300w的功耗打平对手i7,这样悲壮的处理器。在推土机结构上,AMD有很多成本上的考虑,也带来许多超前的概念,但是并没有得到市场的认可,凭AMD的力量不可能重塑X86的生态。推土机架构没有带来AMD期望的性能和利润的双赢,反而使AMD陷入了进一步的深渊。

2012年打桩机架构发布,2014年挖掘机架构发布,这两个架构只是对打桩机的小修小补,AMD的重心也转向APU,通过大幅领先的核显性能,在低端市场保存一些市场份额。

2017年zen架构发布,将8核心处理器带来的民用市场,Intel匆匆推出8代酷睿应战。然而此时的PC市场已经渐渐迈向夕阳,Intel的重心已经不在PC上,除了例行更新制程外,每代酷睿处理器的性能只有10%左右的提升。在PC产业大衰退的背景下,头部的Intel首当其冲,而作为老二的AMD不仅受到的影响小,反而受益于移动芯片制成的发展,迎来了制程的大升级。2016年,Intel宣布放弃移动芯片业务,同年三星电子授权AMD的代工厂GF 14nm制程技术,这是AMD首次在制成上赶上Intel。

zen架构引入了超线程,在单核性能上赶上了Intel的Core,对比推土机架构在IPC上有40%的提升,同时继承了推土机的模块化设计,引入CCX,即使是最低端的ryzen3也可以和ryzen7共用一个die,只需要通过屏蔽核心就可以区分产品定位,不需要额外设计核心,大幅提高了良率。这样尽管在单核性能和制程不占优势下,也可以通过比Intel更多的核心和更便宜的价格赢得市场的青睐。

2018年云计算和AI的高速发展,让数据中心的需求暴增,这股浪潮让Intel处理器严重缺货,万年的14nm产能十分紧张,PC芯片连续涨价,AMD趁机取得了Intel放弃的份额,在部分地区实现了对Intel市场份额的反超,AMD也凭借zen架构便利的核心扩展方式,进军服务器领域,凭借64核的epyc处理器一举拿下最强性能的宝座。AMD的胜利既来自它自身不屈的奋斗精神,也是Intel长期的不作为和市场形势的变化导致的。

2019年,AMD和Intel的已经持续半个世纪的斗争还在继续……

AMD不仅仅是一家半导体公司,更代表着这世界一切弱者的荣耀……

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有