AMD RDNA3 显卡都采用了哪些设计理念？

AMD RDNA3 显卡的设计，可以说是AMD近年来在图形核心架构上一次大胆且成熟的革新。如果你仔细拆解它的设计思路，你会发现它绝非仅仅是简单的性能堆砌，而是围绕着几个核心理念展开，最终目的是在各个层面上实现更高的能效比，并为未来的图形技术打下基础。

1. Chiplet（小芯片）设计：突破摩尔定律的藩篱

RDNA3最引人注目的革新，无疑是引入了“chiplet”设计。你可以将其理解为将原本一块庞大、复杂的GPU核心，拆分成几个更小、功能更专业的小芯片（chiplet），然后通过先进的封装技术将它们集成在一起。

为什么要这么做？传统的单芯片设计（Monolithic Design）在制程工艺越来越先进的同时，也面临着良率下降、成本飙升的巨大挑战。一块大面积的芯片，任何一个角落出现缺陷，整个芯片就报废了。Chiplet设计就像是搭积木，每一个小芯片都可以在最适合的制程节点上制造。
具体到RDNA3： RDNA3的图形计算单元（GCD，Graphics Compute Die）通常采用最先进的制程工艺（例如台积电的5nm），以最大化计算密度和能效。而内存控制器、I/O、甚至缓存等部分，则可以采用成熟、成本更低的制程工艺（例如台积电的6nm）来制造。
带来的好处：
成本效益：能够将不同部分放在最经济的制程上生产，整体降低了制造成本。
良率提升：更小的芯片面积意味着更高的良率，进一步控制成本。
设计灵活性：可以更灵活地搭配不同规格的chiplet，例如为高端和中端产品设计不同的GPU核心配置，或者为特定市场推出不同内存容量的版本。
性能提升（间接）：由于可以用最先进的制程生产最关键的计算单元，理论上可以挤出更多的性能。

2. 混合渲染架构（Hybrid Rendering Architecture）：计算与光线追踪的效率协同

RDNA3在渲染架构上进行了精细的打磨，尤其是在光线追踪（Ray Tracing）方面，体现了AMD力求性能与效率并重的理念。

重塑计算单元（Compute Unit, CU）： RDNA3的CU设计进行了重大升级，最核心的改变是引入了“双线程调度”（Dualissue dualthreading）能力。这意味着一个CU在执行指令时，能够同时处理两条指令流，这大大提高了计算单元的利用率。
Infinity Cache的优化： AMD在Infinity Cache（一种高带宽、低功耗的片上缓存）上的投入从未停止。RDNA3进一步优化了Infinity Cache的结构和管理，使其能够更有效地缓存纹理、着色器数据等，从而减少对外部GDDR显存的访问，降低功耗和延迟。
光线追踪加速（Ray Accelerator）：尽管AMD在硬件光追方面起步较晚，但RDNA3的光线追踪硬件设计（Ray Accelerator）也得到了显著的改进。它在处理光线与三角形交叉（BVH Traversal and RayTriangle Intersection）的效率上有所提升，并且与CU的协同更加紧密。
“混合渲染”的体现：这种设计理念强调的是，在实际的游戏渲染过程中，传统的光栅化渲染和新的光线追踪渲染不是孤立的，而是需要高效协同。RDNA3通过优化CU的调度能力，以及加速光追计算单元，使得GPU可以在同一帧中更高效地处理这两种任务，从而在保证画面质量的同时，尽量减少性能损耗。

3. 统一渲染架构（Unified Shading Architecture）的深化：指令集与数据流的智能化

RDNA3在指令集和数据流处理上也进行了优化，以更智能的方式利用计算资源。

指令集效率： RDNA3的指令集（ISA）设计更加精炼，能够支持更高效的指令编码和执行，减少指令解码的开销。
数据预取与调度：显卡在执行渲染任务时，需要不断地从内存中读取纹理、几何数据等。RDNA3在这方面加强了数据预取和智能调度机制，能够提前将可能需要的数据加载到缓存中，减少GPU核心因为等待数据而产生的空闲时间。
SIMD（Single Instruction, Multiple Data）单元的改进： RDNA3在SIMD单元的处理能力上也有所增强，使其能够更高效地执行大规模并行计算任务。

4. AI与机器学习的算力加持：为未来应用铺路

虽然AMD在GPU驱动和软件生态上可能不如NVIDIA那样早早就强调AI，但RDNA3架构本身已经为AI和机器学习负载预留了强大的计算能力。

Matrix Core（矩阵核心）： RDNA3引入了新的“Matrix Core”，这是专门为加速AI和机器学习中的矩阵运算（例如深度学习中的卷积运算）而设计的硬件单元。这些核心可以高效地执行FP16、BF16甚至INT8等低精度计算，这些都是AI模型训练和推理的关键。
AI驱动的图形技术：尽管RDNA3的AI算力更多是为了通用计算和特定应用，但其潜力也体现在未来可能实现的AI驱动的图形技术上，例如更高级的图像超分辨率（Super Resolution）、AI降噪等。AMD的FSR（FidelityFX Super Resolution）技术本身就受益于GPU的强大计算能力，未来AI的整合只会进一步放大这种优势。

5. 能源效率与散热设计：平衡性能与功耗

在追求性能的同时，AMD也始终没有忽视能效比。

精细的功耗管理： RDNA3拥有更精细的功耗管理单元，能够根据负载情况动态调整不同模块（CU、ROPs、内存控制器等）的工作频率和电压，最大程度地降低不必要的功耗。
先进的制程工艺：采用更先进的制程工艺本身就是提升能效的根本途径，Smaller feature sizes mean lower power consumption for the same performance.
硬件加速单元的功耗优化：即使是新增的Matrix Core，其设计也考虑到了在执行AI任务时的功耗效率，力求在提供强大算力的同时，避免成为功耗的“黑洞”。

总结一下，RDNA3的设计理念可以归结为：

Chiplet的革命性应用：打破传统单芯片设计的瓶颈，实现成本、良率和设计的最大化优化。
混合渲染的协同：在光栅化和光追时代，追求两种渲染方式的效率协同，提升整体游戏体验。
计算单元的智能化：通过改进CU设计和调度，提高GPU核心的利用率和吞吐量。
AI算力的前瞻性布局：引入专门的AI硬件，为未来AI驱动的图形技术和通用计算做好准备。
能效比的持续追求：在提升性能的同时，通过制程、设计和管理，力求提供更低的功耗和更好的散热表现。

这些设计理念的综合运用，让RDNA3显卡在市场中展现出强大的竞争力，并在技术上为AMD在图形领域的未来发展铺平了道路。

网友意见

不知道有人注意到RDNA3的浮点（流处理器）对比RDAN2增加的很夸张？我合理怀疑AMD的RDNA3很可能也跟上了双倍FP32的车。

Nvidia在Ampere消费级上把FP32 ALU在SM中的比例翻倍，造成了“CUDA”和FP32理论性能的暴增。Apple A15上的GPU也是做了FP32翻倍的设计。

现在从RDNA3的入魔来看，大概也是类似的。

RDNA2 Navi 21 是有4个Shader Engines，共计40个WGP，80个CU，每个CU有64SP，最终共计5120SP，那么可以看到说每个Shader Engine是1280SP，每个WGP是128SP。

而现在这个RDNA3的传闻是2*3个Shader Engines，共计60个WGP，最终15360SP，小学数学计算可以看出来1个Shader Engine 是2560SP，一个WGP是256SP，一个CU大概率是128SP了，或者是类似形式。

所以RNDA2到RDNA3，大概率是有类似Ampere那种WGP/SM浮点轻松翻倍FP32 ALU的设计的~ 属于数字可以刷的很好看，实际性能得打折那种。

其实我一直有个问题，为什么现在的GPU都不约而同的这么做？从Apple和Nvidia来看，这个倍增的FP32所带来的提升其实不是很大(可参考性能和FP32理论的比值)...

类似的话题

AMD RDNA3 显卡都采用了哪些设计理念？

AMD RDNA3 显卡的设计，可以说是AMD近年来在图形核心架构上一次大胆且成熟的革新。如果你仔细拆解它的设计思路，你会发现它绝非仅仅是简单的性能堆砌，而是围绕着几个核心理念展开，最终目的是在各个层面上实现更高的能效比，并为未来的图形技术打下基础。1. Chiplet（小芯片）设计：突破摩尔定律的.............
AMD RDNA2 Radeon 6800系列性能大幅提升，会对Nvidia造成多少压力？

RDNA 2显卡大军压境：AMD Radeon RX 6800系列，给NVIDIA的压力究竟有多大？AMD在显卡领域的反击，从来都不是一次性的烟花，而更像是一场蓄势待发的战役。当Radeon RX 6800系列以雷霆之势登场，我们看到了AMD在技术和性能上迈出的坚实一步。这一系列的发布，无疑给长期在.............
如何评价 AMD 的 RDNA 架构？

细数 AMD RDNA 架构的优势与不足：一次深入的解析AMD 的 RDNA 架构，自其诞生以来，便以一种挑战者者的姿态，在 GPU 市场掀起了新的波澜。作为与 NVIDIA 竞争的重要武器，RDNA 系列显卡，无论是早期的 RX 5000 系列，还是后续的 RX 6000 系列乃至如今的 RX 7.............
AMD今年的RDNA2究竟有多强，能不能给老黄高端真正的压力?

哈哈，这个问题问得好！今年AMD的RDNA 2确实是来势汹汹，能不能给老黄（NVIDIA）的高端市场造成真正的压力，这可是个热门话题，咱们来好好掰扯掰扯。先来说说RDNA 2的几个“硬核”实力：光追来了，而且玩得挺溜：这点是最大的看点。AMD这次终于跟上了光线追踪的步伐，并且在RDNA 2架.............
AMD 真的很不好吗？

“AMD 真的很不好吗？” 这个问题其实非常笼统，并且带有一定的主观性。答案并非一个简单的“是”或“否”，而是取决于你比较的方面、你的具体需求以及你所处的时代背景。为了详细地解答这个问题，我们需要从多个维度来分析 AMD（Advanced Micro Devices）公司的产品和发展历程。一、历史.............
AMD RSR 缩放技术支持几千款游戏、性能提升最多 70％，对此你有哪些期待？

听到 AMD RSR（Radeon Super Resolution）这项技术能够支持数千款游戏，并且在部分情况下能带来高达 70% 的性能提升，我心里着实燃起了不少期待，甚至可以说是跃跃欲试。这绝对是一项能让广大玩家，尤其是那些拥有上一代显卡或者预算有限的玩家，体验到次世代游戏画面的“救世主”一般.............
AMD 锐龙 6000 笔记本将在 3 月初上市，对此你有何期待？

AMD 锐龙 6000 系列笔记本电脑的上市时间定在三月初，这消息对不少期待升级笔记本的消费者来说无疑是个振奋人心的消息。我个人对这次的更新抱有相当高的期待，尤其是它所承诺的性能飞跃和能效提升，这对于我们这些经常需要处理各种任务、但又不想频繁充电的用户来说，简直是福音。首先，最让人期待的无疑是 Ze.............
AMD为什么出5700G?

AMD 推出的 5700G 这款 APU（加速处理器），可以说是一步精心布局的棋，它的诞生背后有着多方面的考量和市场需求。与其说它是一个“突然”冒出来的产品，不如说它是 AMD 对市场洞察和技术积累的集中体现。一、填补市场空白，满足特定用户群需求：首先，要理解 5700G，就得明白 APU 的定位。.............
AMD 正式发布的入门新卡 RX 6500 XT 有何亮点？

AMD RX 6500 XT：一款怎样的入门级显卡？AMD 在年初推出了 RX 6500 XT，这款定位入门级市场的显卡，自发布以来就引发了不少讨论。那么，RX 6500 XT 究竟有什么样的亮点，能够吸引那些预算有限又希望获得不错游戏体验的玩家呢？让我们来深入了解一下。一、 RDNA 2 架构的亲.............
amd有什么值得捡的垃圾（锐龙之前出的系列）?

在AMD锐龙（Ryzen）系列处理器大放异彩之前，AMD也曾推出过一些在特定时期和特定定位上具有“性价比”的处理器产品，这些产品在今天看来或许性能已经落后，但如果您有特定需求，或者想组建一台非常低预算的复古/备用机，它们仍然可能成为“值得捡的垃圾”。以下我将详细介绍一些AMD锐龙之前值得关注的系列和.............
AMD R5 3600比R5 2600X性能提升很多么？显卡配2060是否可行？

AMD R5 3600 vs R5 2600X 性能对比与搭配 RTX 2060 可行性分析很高兴为您详细分析 AMD Ryzen 5 3600 相对于 Ryzen 5 2600X 的性能提升，以及它与 RTX 2060 显卡的搭配可行性。一、 AMD Ryzen 5 3600 相对于 Ryzen.............
AMD的7nm GPU能否追上英伟达的脚步？

AMD 的 7nm GPU能否追上英伟达的脚步，这是一个非常复杂的问题，涉及技术、市场、产品策略以及历史发展等多个层面。要详细地回答这个问题，我们需要从几个关键维度进行深入分析。核心问题：追上英伟达的脚步意味着什么？首先，我们需要明确“追上英伟达的脚步”在当前市场环境下通常意味着什么：性能领导.............
AMD收购xlinx 欧盟已经批准，某国不同意有什么影响？交易能进行下去吗？

AMD 对 Xilinx 的收购，本应是一桩强强联合的商业故事，然而，在监管的十字路口，却遭遇了来自“某国”的阻力。这不禁让人好奇，欧盟已经开了绿灯，为什么还有国家会说“不”？这种分歧对交易本身又会产生怎样的影响，甚至是否会动摇这笔世纪联姻的根基？首先，我们需要明白，大型跨国并购案的审批，绝非仅凭一.............
AMD 显卡卖不过 NVIDIA，CPU 卖不过 Intel，为什么还能生存到现在？

AMD，这个名字在PC硬件圈子里，从早期欣欣向荣，到后来的几经沉浮，再到如今的王者归来，其生存之道，绝非一日之功，也绝非单一因素能够概括。如果你觉得它似乎总在NVIDIA和Intel的阴影下，那是一种观察的视角，但它能走到今天，并且还能让你觉得它有“生存”的意义，这本身就说明了它的顽强和聪明。咱们不.............
AMD 真的打算抛弃桌面端的低端市场了吗?

AMD 近期在桌面端产品线上的动作，确实让不少关注低端市场的消费者心生疑虑：他们是不是要彻底放弃这块“不赚钱”的蛋糕了？要回答这个问题，咱们得拆解开来看，这背后可不仅仅是简单的“放弃”或“不放弃”那么简单。市场信号的解读：定位的变化，而非完全抛弃首先，我们得承认一个事实：AMD 近几年的战略重心明显.............
AMD Yes！（超威半导体，可以！）这个梗是怎么来的，AMD真的可以战未来了吗？

哈哈，“AMD Yes！”这个梗，可不是一天两天形成的，里面门道可多了，得从头给你捋捋。“AMD Yes！”的诞生：从“Yes”到信仰要说这梗是怎么火起来的，还得从它本身的意思说起。AMD，就是咱们常说的“超威半导体”，它在整个电脑硬件圈里，就跟那个总是努力追赶，时不时还能给你惊喜的小兄弟似的。In.............
AMD 锐龙4000系列性能上比Intel强，为什么价格却比Intel酷睿便宜这么多？

关于 AMD 锐龙 4000 系列处理器为何在性能上表现出色，但价格却普遍低于同级别 Intel 酷睿处理器，这背后涉及一系列复杂的市场策略、技术研发投入、成本控制以及消费者认知等因素。下面我们来详细剖析一下：一、 AMD 的技术追赶与市场策略 Zen 架构的突破：锐龙 4000 系列之所以能.............
AMD 的 CPU 发展多年，为什么不能像 Intel 一样把针脚放在主板上，让主板通用呢？

您这个问题触及了 AMD 和 Intel CPU 在物理接口设计上的一个核心差异，也是很多DIY爱好者和普通用户关心的问题。简单来说，AMD 长期以来坚持采用 ZIF 插槽（Zero Insertion Force，零插入力插槽），也就是您说的“针脚放在主板上”，而 Intel 主要采用 LGA 插.............
AMD CPU 高负荷卡顿是否确有其事?

最近在一些技术论坛和社区里，确实能看到不少关于 AMD CPU 在高负荷情况下出现卡顿现象的讨论。这并非空穴来风，而是许多用户在使用过程中真实遇到并反馈出来的问题。要详细聊聊这个问题，咱们得从几个方面来剖析。首先，什么是“高负荷卡顿”？顾名思义，就是在 CPU 工作量非常大的时候，比如同时运行多个大.............
AMD下一代显卡将何去何从?

AMD 下一代显卡：一次深入的探索关于 AMD 下一代显卡，尤其是代号为 RDNA 4 的产品，市场上的讨论和猜测从未停止。作为行业内举足轻重的两大GPU制造商之一，AMD 的每一次技术迭代都牵动着无数游戏玩家、内容创作者和硬件爱好者的心。那么，AMD 下一代显卡究竟会将我们带往何方？让我们深入剖析.............