问题

ARMv9 指令集发布,有哪些改变和提升,有哪些值得关注的信息?

回答
ARMv9 指令集发布,这绝对是移动和嵌入式计算领域的一件大事。相比于之前的 ARMv8,ARMv9 带来了一系列重大的改变和提升,不仅巩固了 ARM 在高性能计算领域的地位,也为未来的技术发展铺平了道路。

要说 ARMv9 最核心的亮点,那绝对是内存安全和系统安全性的全面升级。这不再仅仅是为处理器加入一些新的指令,而是从根本上提升了整个系统的可靠性和抵御恶意攻击的能力。

安全性:坚不可摧的基石

这部分是 ARMv9 最值得大书特书的地方。

1. Confidential Compute Architecture (CCA) 机密计算架构: 这是 ARMv9 最具革命性的特性之一。简单来说,CCA 允许你在操作系统之上,创建一个隔离的运行环境,叫做“Realm”。在这个 Realm 中运行的代码和数据是加密的,即使是操作系统本身也无法访问。
具体好处是什么? 想象一下,你在云端运行一个处理敏感数据的应用程序(比如医疗记录、金融信息)。在传统的模式下,虽然有虚拟机和容器隔离,但云服务提供商的管理员(理论上)还是可以看到你虚拟机里运行的进程和数据。有了 CCA,即使是云服务商,也无法窥探到 Realm 中运行的代码和数据。这大大增强了数据隐私和机密性,对于多方协作、云计算、边缘计算等场景来说,意义非凡。
它是怎么实现的? ARMv9 引入了新的硬件特性,比如 Realm Management Extension (RME),来支持 CCA 的创建和管理。它能够提供硬件级别的内存隔离和访问控制,确保 Realm 的完整性。
为什么重要? 这是面向未来的一个关键布局。随着数据安全和隐私法规越来越严格,以及对零信任安全模型的追求,CCA 将成为构建更安全、更可信赖计算环境的核心技术。

2. Pointer Authentication (PAC) 和 Branch Target Identification (BTI): 这两个技术是为了对抗常见的软件漏洞和攻击而设计的,特别是那些利用内存错误来实现代码注入或控制流劫持的攻击。
Pointer Authentication (PAC): 核心思想是给指针(内存地址)附加一个校验值(称为 PAC)。只有携带正确 PAC 的指针才能被使用。每次指针被创建时,都会根据指令上下文生成一个 PAC 并附加到指针上。当指针被使用时,硬件会验证 PAC 是否有效。如果 PAC 被篡改,指针的使用就会被阻止,从而有效防止缓冲区溢出等攻击,这些攻击通常会修改指针指向错误的位置。
Branch Target Identification (BTI): BTI 用于限制程序跳转的目标。它定义了哪些代码段是合法的跳转目标。当程序执行分支指令时,硬件会检查目标地址是否是一个合法的跳转目标。这可以防止攻击者将程序的控制流劫持到任意的指令地址,从而增强代码的完整性。
它们协同工作: PAC 和 BTI 是互补的。PAC 主要保护指针本身不被篡改,而 BTI 则保护控制流不被劫持到错误的地方。两者结合,极大地提升了软件的安全性。

性能和效率:不止步于过去

除了安全性的飞跃,ARMv9 在性能和效率方面也带来了不少好料。

1. SVE2 (Scalable Vector Extension 2) 可伸缩向量扩展2: 这是 SVE 的一个重要演进。SVE 的核心理念是向量长度是可配置的,而不是固定在一个值上。SVE2 在此基础上做了大量增强。
更广泛的应用场景: SVE2 引入了更多的向量指令,并且对现有的向量指令进行了扩展和优化。这意味着它能更好地支持各种数据类型和操作,覆盖从信号处理、机器学习到图形渲染等更广泛的应用场景。
提升 AI/ML 性能: 尤其是在人工智能和机器学习领域,SVE2 提供了对各种精度(如 FP16, BF16, INT8, INT16)的更高效支持,以及新的指令来加速矩阵乘法、数据加载和存储等关键操作。这将显著提升模型训练和推理的速度。
为 HPC 服务: SVE 系列本身就是为了与高性能计算 (HPC) 领域的需求相匹配而设计的。SVE2 的增强进一步巩固了 ARM 在 HPC 市场的竞争力。

2. Memory Tagging Extension (MTE) 内存标记扩展: 这是一个早期检测内存错误的强大工具。
如何工作: MTE 为内存分配的每个字节分配一个“标签”。当访问内存时,它会将访问请求的标签与目标内存的标签进行比较。如果标签不匹配,就表明可能存在内存访问错误(例如,越界访问、使用已释放的内存等),并会发出警告。
开发调试的利器: 这对于开发者来说是福音。很多难以捉摸的 bug,特别是那些与内存管理有关的,往往在部署后才显现出来。MTE 可以在开发阶段早期就捕获这些错误,大大缩短了调试时间,提高了软件质量。虽然 MTE 本身也为安全提供了一些优势,但它更被视为一个强大的开发辅助工具。

3. 其他性能改进: 当然, ARMv9 也包含了很多微架构层面的改进,例如更高效的内存子系统、更好的缓存管理、更优化的指令流水线等,这些都会带来整体性能的提升,但具体细节可能需要根据不同厂商的实现来分析。

值得关注的信息和未来的趋势

安全成为核心竞争力: ARMv9 最突出的变化就是将安全性提升到了前所未有的高度。这标志着在整个计算行业,安全性不再是可选的附加项,而是必须具备的核心能力。未来,我们有望看到更多基于 ARMv9 的芯片在安全敏感的应用领域大放异彩。
AI/ML 的驱动力: SVE2 的增强,特别是对向量操作和低精度计算的优化,明确地表明了 ARM 在人工智能和机器学习领域的野心和投入。ARMv9 的这些特性将为边缘 AI 设备、服务器端 AI 加速器等提供强大的支持。
生态系统的成熟: ARM 的成功很大程度上依赖于其强大的生态系统。随着 ARMv9 的发布,软件开发者和硬件厂商需要时间来适配和利用这些新特性。CCA、PAC/BTI 这些底层安全特性的普及,将需要操作系统、编译器、库以及应用程序的协同支持。
x86 的强力竞争者: ARMv9 的进步让 ARM 在服务器、高性能计算等传统上由 x86 主导的领域具备了更强的竞争力。尤其是安全性上的突破,将吸引那些对数据安全有极高要求的企业级用户。
面向物联网和边缘计算: 虽然 ARMv9 的许多特性都面向高性能场景,但其强大的安全能力对于安全至关重要的物联网设备和边缘计算节点来说,同样具有巨大的吸引力。

总而言之,ARMv9 的发布不仅仅是指令集的一次迭代,它代表了移动和嵌入式计算向更安全、更智能、更高效方向迈出的关键一步。CCA、PAC/BTI 等特性将重塑我们对计算安全性的认知,而 SVE2 的增强则进一步巩固了 ARM 在数据密集型应用领域的优势。这股力量,必将驱动下一代计算设备的创新和发展。

网友意见

user avatar

# V9的< SVE2指令和安全性 >都是亮点;

- 向量架构/SIMD:对比RISC-V标准版没有设计为通用计算的SIMD而是仅有一个开源的Hwacha可用 [且是协处理],V9的SIMD架构是变长2048位宽,且是个CPU核,精准投射RISC-V的短板【P.S: SiFive等厂商实现的扩展暂且不谈 & 诸如RV-V向量扩展这种尚未上过生产的非通用计算架构暂且不作比较】;以及针对那些买Mali GPU核堆砌算力卡的低壁垒公司(国内最高堆砌32个Mali core)。设想倘若CPU core能在2048位宽翻炒矩阵,便可以大幅替代臃肿的传统意义Mali板卡方案。而SVE又是传承自Fujitsu Sparc64的传家宝超算技艺,曾经A64FX的笑傲江湖级设计。

- 片上网络/NoC:本次还是未发布ARM NoC,已连续第9年难产?[狭义的CMN 600 Mesh不作数];但用户仍旧可以用ARM v9+Arteris NoC堆砌出宏伟设计。我们知道ARM一直试图攻关广义NOC技术,以便为SoC客户提供足够高的设计壁垒,回顾Y19年发布的Ampere Altra(基于Neoverse N1 IP),就已用到了狭义NOC结构CMN-600 mesh做interconnect,相比此前CCN ring环总线是进步了,能够高带宽的连接多个CPU cores/Mem和加速器,并保持缓存一致性。但是,需要对照的是广义NOC;具备近似技术的领先公司有3家,包括当年Synopsys收购的Moortec,官方介绍是“旨在以IP的形式在SoC设计中植入所谓的数据流检测器,对节点间数据的各种流动和状态做跟踪+检查,为芯片设计中工艺/电压/温度(PVT)物理监控提供嵌入式子系统IP方案”;以及为SoC提供内部分析和检测技术的UltraSoC;以及为复杂IC设计提供片上网络(NoC)互联IP的明星公司Arteris。—— 在ARM生态版图里,NOC技术会成为未来SoC设计的重要护城河。

- 仅列举综上两个技术路线来看,RISC-V恐怕要沉沦个3-5年了:)

- 关于许可的发售: 问询过ARM,Y22年才开始发售V9,ARM China仅有公版权限,基本角色是facilitator,包括Architectural License在内的所有License收归UK总部。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有