首页

函数调用带来的 cache miss 会对 cpu 性能带来多大的影响？第1页

1

Ultraman-Tiga 网友的相关建议:

【update：原答案写于7年前，现在根据自己接触过的相关工作和数据重新更新。】

泻药，这是非常好的一个问题，同时也是比较前沿的。

题目描述中的这个现象确实存在，已经有不少实测证明了，在服务器workloads上，现在的L1 instruction miss率是比较差劲的，会导致20%-40%的性能损失在front-end上。

instrcuction miss比较特殊，是乱序执行没办法掩盖的。乱序执行要调度不相干指令上来掩盖数据访问延迟，但是如果指令都取不上来也只能干瞪眼了。

分条回答：

1. 是的，但这个非常取决于workload。我接触过的真实服务器workloads，在front-end上的性能损失会达到SPECCPU的几倍。

2. 假设一个完全不miss的L1 Intruction Cache，性能在有的benchmark上可以提高10%～50%

3. 不清楚，未见相关实测数据。

4. 解决方案有两种：

一种是编译优化时调整代码布局，这一个方向我没有跟进过不敢多说，

另一个方向是由微结构负责从已经产生的miss中推断未来miss的位置，提前预取。Umich在这个方向有一系列不错的工作，但是他们的解决方案在开销方面可能存有疑虑，以及对stack上的信息有一些隐含假设，不一定对各种服务器workloads都成立，这个方向我还会继续跟进。

函数调用带来的 cache miss 会对 cpu 性能带来多大的影响？的其他答案点击这里

1

相关话题

  怎么避免写Java风格的Scala代码？
  Amd R5 3400g和Amd R3 4350g哪个好？
  有哪些让你目瞪口呆的 Bug ？
  如何看待 NVIDIA 称「我们的 GPU 显卡比 CPU 节能 42 倍」？
  如果中国一开始就禁止微软和英特尔AMD进入中国大陆地区，现在的中国大陆地区会出现哪些现象？
  GPU核心为什么会以显卡这种形式进行销售？
  C语言学到什么程度可以看Lua的源码？
  vscode是用什么语言写出来的？为什么华为能做出鸿蒙系统，却开发不出类似vscode的开发工具？
  编程语言发展史上有哪些趣事？
  大一计算机专业怎么利用好寒假?

前一个讨论

经常上知乎会带来什么错觉？

下一个讨论

有些中国人为什么不愿意买商业保险?

相关的话题

  成功重构了代码是种怎样的体验？
  Java如何打好牢固的基础？
  为什么程序员的工资比其他行业高这么多？
  刷完算法导论和leetcode，能找到什么水平的工作？
  JVM 常量池中存储的是对象还是引用呢？
  为什么我用c++写的游戏那么简陋？
  虽然 AMD YES 但现实推荐中，中高端机型绝大部份人还是推 Intel，这是我的错觉吗?
  为什么 GPU 的通用计算能力高于 CPU？架构原因？内核数量？
  我听说以前的系统没有图形界面，那他们是用 C# 等语言直接敲代码吗？
  如何看待 GitHub 上许多学习笔记、面经等项目获得过多的 star？
  写过十年代码是种怎样的体验？
  打这样的代码用了一小时零十分钟，大概是个什么手速?（我是初学者中的初学者）?
  计算机随机生成一个数是不是真的是随机的？
  如何使用 python 写一个简单的表达式解释器？
  CPU不满载的时候，晶体管在干什么？
  中国的芯片现状如何？
  将近十年后，如何评价AMD收购ATi？
  为什么最近十年发明的编程语言都喜欢先变量名后类型声明这种变量声明方式？
  为什么现代电脑游戏无法对cpu的多核充分利用?
  首届 RISC-V 中国峰会 2021 年 6 月 21 日起在上海举行，有什么值得关注的地方？
  如何拯救编程能力?
  华为海思的水平如何？
  为什么同样是解决一个问题，别人就能想出算法，而我却绞尽脑汁，百般尝试也不得其法？
  Java中有哪些设计精良的部分（精华），还有哪些是不值得花费很多时间探究的知识点？
  Intel 官宣首款「矿卡」，能效比碾压 GPU 显卡千倍，对这一性能你有哪些评价？
  如果未来英特尔不再为大陆提供服务，对中国发展有何影响？
  如何看待华为自研编程语言「仓颉」试用开启，汉字编程靠谱吗？
  听说CPU性能=IPC×频率，IPC怎么查询呢？
  决定同时执行线程数的是逻辑核还是物理核?
  能否通过逻辑编程消灭程序BUG？

© 2025-07-02 - tinynew.org. All Rights Reserved.
© 2025-07-02 - tinynew.org. 保留所有权利