CPU 的指令集存放在什么地方？

CPU 的指令集，简单来说，就是计算机能听懂的一系列基本命令。你可以想象成 CPU 是一台需要严格按照手册才能工作的机器，而指令集就是这份手册。那么，这份“手册”到底放在哪里呢？这其实是一个涉及硬件和软件协同工作的问题。

首先，我们要明确一点，CPU 本身并不直接存储指令集。CPU 是一颗精密的电子元件，它的核心是负责执行指令的逻辑电路（比如算术逻辑单元 ALU、控制单元 CU 等）。它需要读取指令才能工作。

那么，指令是从哪里来的呢？这就要说到 CPU 的工作流程了。

1. 指令的来源：内存（RAM）与缓存（Cache）

绝大多数时候，CPU 需要执行的指令都存放在计算机的主内存（RAM）里。当你要运行一个程序时，这个程序的可执行文件会被从硬盘（或者更快的固态硬盘 SSD）加载到 RAM 中。RAM 就像是一个临时的工作台，程序需要的指令和数据都暂时放在这里，以便 CPU 能够快速访问。

不过，直接从 RAM 读取指令对 CPU 来说速度还是不够快。CPU 的工作速度远超 RAM 的访问速度。为了解决这个“瓶颈”，CPU 内部设计了多级缓存（Cache）。

缓存（Cache）：这是存放在 CPU 芯片内部或非常靠近 CPU 的高速存储区域。它会根据 CPU 预测接下来可能需要执行的指令和数据，提前将 RAM 中的一部分内容复制到缓存中。
缓存的层级：通常有 L1、L2、L3 缓存。L1 是最小、最快的一级缓存，通常分为指令缓存和数据缓存。L2 缓存比 L1 大，速度稍慢。L3 缓存更大，速度更慢，但仍然远比 RAM 快。
指令的“流动”：当 CPU 需要执行一条指令时，它会先在 L1 指令缓存中查找。如果找到了（称为“缓存命中”），就直接从 L1 读取执行。如果没找到，就去 L2 查找，再到 L3，最后才去 RAM。这个过程就像是你手头有几个笔记本，最常用的写在面前的便利贴上（L1），不常用的就放在书桌的抽屉里（L2、L3），最不常用的才去图书馆借（RAM）。

2. 指令的“原型”：固件（Firmware）和微码（Microcode）

你可能会问，那最最底层的指令是什么呢？CPU 刚上电的时候，内存里的程序还没加载进来，它怎么知道自己该做什么呢？

固件（Firmware）：在主板上通常会有一颗小芯片，里面存储着 BIOS (基本输入输出系统) 或 UEFI (统一可扩展固件接口) 程序。这个程序是计算机开机后最先运行的，它负责进行一些硬件的初始化检测，比如检查内存、显卡等，然后最重要的是，它会负责从硬盘加载操作系统的引导程序到内存中。BIOS/UEFI 里的这些指令，在某种程度上也是“指令集”的一部分，但不是我们通常意义上说的 CPU 的指令集。
微码（Microcode）：这才是真正让 CPU 内部逻辑电路能够理解的“底层指令”。CPU 内部的指令集（比如 x86、ARM 等）是非常复杂的，一条我们在高级语言里写的命令，编译成机器码后，可能对应着多条 CPU 能理解的更基础的微码指令。
微码存储在哪里？微码通常被固化在 CPU 芯片内部的 ROM (只读存储器) 或类似的特殊存储区域里。你可以把微码看作是 CPU 芯片自带的、最基础的“解码器”和“执行单元的驱动程序”。当 CPU 接收到一条高级指令时，它内部的控制单元会根据存储在芯片内的微码来解释这条指令，并将其分解成更细粒度的微操作，然后驱动内部的电路去执行这些微操作。
微码的更新：虽然微码是固化的，但有些情况下（比如修复 CPU 的安全漏洞或性能问题），厂商可以通过操作系统或 BIOS/UEFI 更新来“微调”或“替换”CPU 的部分微码。这是一种非常底层且特殊的更新方式。

总结一下指令集的存储位置和流程：

1. 程序源代码/高级语言编写的指令：存储在硬盘/SSD 的可执行文件中。
2. 编译后的机器码（低级指令）：当程序运行时，被加载到内存 (RAM) 中。
3. CPU 高速缓存 (Cache)：RAM 中的一部分指令被复制到 CPU 内部的多级缓存（L1, L2, L3）以提高访问速度。CPU 的指令获取首先从 L1 指令缓存开始。
4. CPU 内部的微码 (Microcode)：这是 CPU 最底层的指令集，固化在 CPU 芯片内部的 ROM 或专用存储区。它负责解释和执行由内存中加载的机器码指令。

所以，当我们说“CPU 的指令集存放在哪里”时，更准确的说法是：

CPU 能直接理解并执行的最低级指令（微码）是固化在 CPU 芯片内部的。
CPU 工作时需要执行的绝大多数程序指令（机器码）则存放在内存 (RAM) 中，并通过 CPU 内部的缓存 (Cache) 加速访问。

这个过程就像是你在写一本书（源代码），然后出版社出版成印刷品（机器码），你直接阅读印刷品（RAM），但为了快速查找内容，你还可以在书里做笔记或者夹书签（Cache）。而书本本身（微码）是出版后就定下来的基本格式和语言规则。

网友意见

(已更正) 这个问题包括CPU的硬件结构和汇编语言的范畴. 这里梳理一下.

首先, 题主"李建国"自问自答的部分说的是正确的, CPU的指令集是软件与CPU这两个层级之间的接口, 而CPU自己, 就是对于这一套CPU指令集的"实例化".

无论处于上层的软件多么的高级, 想要在CPU执行, 就必须被翻译成"机器码", 翻译这个工作由编译器来执行. 编译器在这个过程中, 要经过"编译", "汇编", "链接"几个步骤, 最后生成"可执行文件". 可执行文件中保存的是二进制机器码. 这串机器码可以直接被CPU读取和执行.

软件意义上, "指令集"实际上是一个规范, 规范汇编的文件格式.

以下为一条x86汇编代码:

mov word ptr es:[eax + ecx * 8 + 0x11223344], 0x12345678

这里可以体现出指令集的格式限制:

1. 可以使用mov指令, 但它只能有2个操作数.

2. 它的操作数长度是16 (word), 不要看到后面0x12345678就认为是32位操作数.

3. 它带有段超越前缀, 这里使用了es, 还可以使用ds, cs, ss, fs, gs. 但是只能用这几个.

4. 第一个操作数是一个内存地址, 第二个是立即数. 但是, 这个内存地址不能乱写, 写成[eax+ecx*10+0x11223344]就错了.

实际上, 一条汇编指令与一段机器码是一一对应的. 上面这段汇, 可以被x86编译器翻译成几乎唯一的一段机器码:

26 66 c7 84 c8 44 33 22 11 78 56

上面提到的1,2,3,4点如果有一个弄错, 这一步就会失败.

可以看出来, 指令集的作用, 就是告诉程序员/编译器, 汇编一定要有格式. 支持什么指令, 指令带什么限制条件, 用什么操作数, 用什么地址, 都是指令集规范的内容, 要是写错了, 就无法翻译成机器码.

指令集规范汇编, 汇编可以翻译成机器码, 机器码告诉CPU每个周期去做什么. 因此, CPU指令集是描述CPU能实现什么功能的一个集合, 就是描述"CPU能使用哪些机器码"的集合".

那机器码进入到CPU后又做什么呢?

=====================编译器和CPU的分界线========================

需要被执行的机器码先要被OS调度到内存之中, 程序执行时, 机器码依次经过了Memory--Cache--CPU fetch, 进入CPU流水线, 接着就要对它进行译码了, 译码工作生成的象是CPU内部数据格式, 微码(或者类似的格式, 这个格式不同的厂商会自己设计).

这个过程画成图就是:

软件层: 汇编语言

------------------------------------------------------------------------

接口: 汇编语言所对应的机器码

------------------------------------------------------------------------

硬件层: CPU使用内部数据结构进行运算

如果机器码代表的功能是在指令集规范内的, 这条机器码就可以生产微码, 并在CPU内正常流动. 假设机器码是错误的, 是不可以通过CPU的译码阶段的, 控制电路一定会报错. 这种情况反映在Windows里往往都是蓝屏, 因为CPU无法继续执行, 它连下一条指令在哪都不知道.

那么指令集在CPU里就代表: 只有CPU指令集范围内的指令可以被成功的译码, 并送往CPU流水线后端去执行.

和常规的想法不一样, CPU不需要任何形式的存储介质去存储指令集, 因为"译码"这个步骤就是在对指令集里规范的机器码做解码. 硬件上, 译码这件事需要庞大数目的逻辑门阵列来实现.

跳出格式这个圈子来看待这个问题. 可以说, CPU执行单元的能力, 决定了指令集的范围. 比如, CPU的执行单元有能力执行16位加法, 32位加法, 64位加法, 那么指令集里一般就会有ADD 16, ADD 32, ADD 64这样的表达方式. 如果CPU的执行单元没有电路执行AVX指令, 那么指令集里一般就没有VINSERTF128这样的指令供使用. 所以, 强有力的执行单元能够提供更多的指令集.

再来看"CPU指令集在哪里"这个问题, 回答是, CPU本身就是CPU指令集. 指令集规定CPU可以做什么事, CPU就是具体做这件事的工具. 如果一定要指定一个狭义的CPU指令集的存放位置. 那就是CPU中的"译码电路".

首先，指令集不是具象化物体，不会放在CPU物理结构的某个地方。也不是数据，可以存在缓存、存储器或者寄存器阵列中。

指令集是CPU中用来计算、存储、控制计算机系统的一套指令的集合。指令集可以认为是计算机软件和硬件之间的接口，是软件如何控制硬件的计算机抽象模型的一部分。在CPU架构设计的开始，就要进行指令集的设计，因为指令集决定了CPU能够做什么以及如何做。

不仅如此，指令集也定义了CPU支持的数据类型、寄存器、硬件如何管理主内存、关键特性(如虚拟内存)等

举个不太恰当的例子，我想从上海去北京，可以把上海去北京的任务看成CPU中一个指令集或者多个指令集才能完成的任务，那么不同的指令集效率也不同。

X86指令集在执行上海到北京的任务时，方式是坐飞机，ARM指令集则是坐火车，不同任务在不同的指令集下执行效率是不一样的，此时X86可能更快些。但如果任务换成做一顿丰盛的大餐，可能ARM更快一些。

比如此时我设计了一套非常牛逼的指令集，就叫NB指令集吧，它执行上海到北京的任务的方式是“闪现”，那么效率就碾压X86和ARM，我将走向人生巅峰。

与此同时，我的一位同事也设计了另一套指令集，简称FW指令集。但这套指令集从北京到上海采用的方式是“疾跑”，结果不仅效率差，还异常耗电，没有多久这个CPU就挂了，几个月后，我这个同事就被裁了。

还有，我的另一位同事也设计了一套指令集，简称LJ指令集，这套指令集非常失败，无法实现上海到北京的任务，因为他没去过北京也不知道北京怎么走，结果被老板边缘化，半年后就去投奔前一个被裁的同事去了。因为那个被裁的同事在新公司拿了double的薪资。

所以回过头来看，坐飞机、乘高铁、用闪现、疾跑，以及去不了北京这些方式存在什么地方吗？并没有，但是要实现这些方式，你得有飞机、机场、高铁、车站、飞毛腿等设施，而这些设施的本质，就是CPU的晶体管电路本身。

CPU是某个特定的指令集在硬件上的实现。它本身并不知道为什么要这么做，也不知道它在做什么，它存在的终极目的就是“实现”这个指令集。

类似的话题

CPU 的指令集存放在什么地方？

CPU 的指令集，简单来说，就是计算机能听懂的一系列基本命令。你可以想象成 CPU 是一台需要严格按照手册才能工作的机器，而指令集就是这份手册。那么，这份“手册”到底放在哪里呢？这其实是一个涉及硬件和软件协同工作的问题。首先，我们要明确一点，CPU 本身并不直接存储指令集。CPU 是一颗精密的电.............
华为麒麟 CPU 的指令集是从哪国哪家公司买来的技术？

华为麒麟芯片的指令集，实际上是基于ARM架构的。ARM（Advanced RISC Machines）公司，总部位于英国，是一家全球领先的半导体知识产权（IP）提供商。华为麒麟CPU所使用的指令集，就是ARM公司授权的ARMv8A架构指令集。这里需要解释一下什么是“指令集”以及华为与ARM之间的关系.............
什么是指令集？CPU的指令集是怎么运作的？X86、ARM、MIPS、Alpha、RISC等有什么区别？

好的，让我们深入探讨一下“指令集”这个概念，并聊聊CPU是如何消化和执行这些指令的，最后还会比较一下几个耳熟能详的指令集架构。我会尽量用一种更自然、更贴近实际的语言来阐述，避免那些生硬的AI腔调。指令集：CPU的语言想象一下，CPU就像一个超级勤奋但又有点“笨”的工人。它什么都知道，但它只能听懂非.............
x86 win32下的汇编指令集可认为是 cpu提供的指令集 + win32提供的指令集吗？

好的，我们来聊聊 x86 Win32 下的汇编指令集，以及它和我们常说的“CPU 指令集”以及“Win32 API”之间的关系。首先，明确一个概念：x86 Win32 下的汇编指令集，核心还是 CPU 提供的指令集。Win32 API 并不是 CPU 直接执行的“指令集”，而是操作系统提供的一套接口.............
怎么知道自己电脑的CPU支不支持AVX指令集？以及如何使用这些指令集？

想知道你的电脑处理器（CPU）有没有AVX（Advanced Vector Extensions）指令集？这玩意儿听着挺高大上的，简单说就是CPU能同时处理更多数据，速度更快，尤其是在做一些科学计算、音视频处理、加密解密这些重活儿的时候。下面我就掰开了揉碎了跟你唠唠，保证不弄得跟AI报告似的。第一.............
CPU（为方便讨论，这里仅限32位X86指令）的各种构架，比如奔3，奔4，对纯加法运算速度有帮助吗？

咱们就聊聊CPU那点事儿，特别是奔三和奔四这俩大家伙，它们对咱们纯加法运算到底有多大帮助。要说起这个，得从 CPU 的“内功”说起，也就是它处理指令的方式。CPU 的“内功”：流水线和乱序执行想象一下流水线生产，一个零件传到下一个工位，一步一步完成。CPU 里也有类似的东西，叫做流水线（Pipeli.............
对于多核CPU java中Thread.currentThread() 指的是哪个核上的线程？

在多核CPU环境下，Java中的`Thread.currentThread()`调用返回的是一个`Thread`对象，它代表了当前正在执行这个方法的线程。然而，这个`Thread`对象本身并不直接包含它当前被调度执行在哪一个具体的CPU核心上的信息。你可以这样理解：线程是一个逻辑概念，CPU核心是物.............
CPU 的性能是不是快到天花板了？为什么？

这是一个非常有趣且复杂的问题，要回答“CPU 的性能是不是快到天花板了？为什么？”，我们需要从多个角度进行深入探讨。简单来说，不能一概而论地说CPU性能已经达到了绝对的天花板，但我们确实正面临着一些前所未有的物理和工程挑战，使得持续的、指数级的性能提升变得越来越困难。下面我将详细阐述原因：一、历.............
CPU 的摩尔定律是不是因为 10 纳米的限制已经失效了？10 纳米之后怎么办？

CPU 摩尔定律的“失效”与“10纳米限制”以及“10纳米之后怎么办”是当前半导体行业非常热门且复杂的话题。让我们来详细解读一下： CPU 摩尔定律的“失效”与“10纳米限制”首先要明确一点：严格意义上的、按照经典定义（晶体管数量每1824个月翻一番）的摩尔定律，在物理上和经济上都面临着巨大的挑战，.............
CPU 的工作原理是什么？

CPU（中央处理器）是计算机的大脑，负责执行计算机程序的所有指令。它的工作原理虽然复杂，但可以分解为几个核心阶段和组件。下面我将详细地解释 CPU 的工作原理：CPU 的核心组成部分：在深入工作原理之前，了解 CPU 的主要组成部分至关重要：1. 算术逻辑单元 (ALU Arithmetic L.............
CPU 的运行速度受光速影响吗？

CPU 的运行速度，说到底，就是它内部电子信号传递的速度。你可能会想，电子信号里面有电子，而电子是可以运动的，那么它的速度会不会受到“光速”这个终极速度的限制呢？咱们得从几个层面来聊聊。首先，CPU 内部最核心的工作就是处理电信号，这些电信号在导线上传播。你可以把这些导线想象成微型的电线。当一个电信.............
CPU的功耗和什么相关？为什么一个while(1);就可占满CPU的功耗？

CPU 的功耗与很多因素息息相关，远不止是执行简单指令那么简单。它是一个复杂的能量消耗过程，可以分解为以下几个主要部分：CPU 功耗的几个主要组成部分：1. 动态功耗 (Dynamic Power): 这是 CPU 在工作时最主要的功耗来源，与 CPU 的活动程度直接相关。它的主要构成是： .............
CPU的一级缓存为什么不能做得大一点？

你想知道为什么 CPU 的一级缓存（L1 Cache）不能做得更大一些，是吧？这个问题挺有意思的，因为它触及了 CPU 设计中最核心的权衡和挑战。简单来说，虽然理论上缓存越大越好，能存更多数据，但现实中一级缓存之所以“小”，是因为它的设计目标非常明确，而且一旦增大，就会引发一系列连锁反应，让 CPU.............
cpu的核心模式和用户模式是不是就是root和不root的区别？

CPU 的核心模式和用户模式，以及我们常说的“root”和“不 root”权限，它们之间确实有很紧密的联系，但又不是完全等同的概念。更准确地说，核心模式/用户模式是 CPU 硬件层面上区分不同运行状态的一种机制，而 root/不 root 权限则是操作系统层面基于这种硬件机制实现的权限管理概念。让我.............
CPU有带显卡的，那显卡有带CPU的吗？为什么我买了显卡不买CPU开不了机？

哈哈，这个问题问得很有趣！你买显卡不买CPU开不了机，这就像问为什么你买了汽车的车轮，但没有发动机它就不能跑一样。咱们来掰开了揉碎了好好说说。CPU：电脑的“大脑”首先，咱们得明白CPU是什么。CPU，全称中央处理器（Central Processing Unit），是电脑最核心的那个部件，你可以把.............
AMD的cpu的笔记本可以换Intel的cpu嘛？

这个问题其实非常普遍，很多朋友在购买笔记本时，可能会纠结于AMD和Intel两大阵营，或者在日后想升级设备时，会想到这个问题。简单来说，AMD CPU 的笔记本，通常情况下是不能直接更换为 Intel CPU 的。这背后的原因，我们要从笔记本电脑的硬件设计和兼容性上好好捋一捋。1. 核心的差异：CP.............
CPU-Z如何识别CPU的制程呢？

CPUZ 这款小巧的软件，能把我们电脑里那个看不见的“大脑”——CPU——的方方面面都摸个一清二楚，其中有个很关键的信息就是它的“制程工艺”。咱们今天就来聊聊，CPUZ 是怎么把这个挺技术性的数字给咱们展示出来的，而且是怎么做到这么准确的。首先得明白，“制程工艺”到底说的是啥。简单来说，它代表了.............
为什么cpu的浮点计算能力差，什么是浮点计算，gpu为什么擅长浮点计算？

浮点计算，简单来说，就是计算机处理带有小数点的数字的能力。这和我们平时计算整数（比如数苹果）不太一样。比如，你要计算一个物体的运动轨迹，速度可能是每秒 3.14 米，加速度是 9.81 米/秒²，这时候就离不开浮点数了。什么是浮点计算？浮点计算的“浮点”二字，形象地比喻了小数点的位置是可以“浮动”.............
为什么CPU的制程不能跨代发展？

CPU制程的“代沟”：为何不能跳级？我们常听到CPU制程又进步了，从10nm到7nm，再到现在的5nm、3nm，甚至更小的节点。这种数字上的进步，就像汽车排量、手机像素一样，似乎是越小越好，越先进越牛。但你有没有想过，为什么CPU的制程不能像坐火箭一样，一下子从10nm直接跳到1nm，或者从5nm直.............
为什么 CPU 的浮点运算能力比 GPU 差，为什么不提高 CPU 的浮点运算能力？

在深入探讨 CPU 的浮点运算能力为何不如 GPU，以及为何不单纯堆高 CPU 的浮点运算性能之前，咱们得先理清楚它们各自的“出身”和“使命”。想象一下，CPU 就像一个全能型的瑞士军刀，它设计之初就是要应对各种各样、千变万化的计算任务。它需要能够高效地处理逻辑判断（比如“如果…那么…”）、整数运算.............