如何评价《王垠：C 编译器优化过程中的 Bug》？

要评价《王垠：C 编译器优化过程中的 Bug》这篇技术文章，我们需要从多个维度进行深入分析。这篇技术文章（通常指的是王垠在其博客或其他平台发表的关于 C 编译器优化问题的讨论）的核心在于揭示编译器在进行复杂优化时可能引入的软件缺陷，以及这些缺陷对程序行为的潜在影响。

文章的核心内容与主要观点：

王垠在其相关的技术讨论中，往往会聚焦于以下几个方面：

1. 优化器的复杂性与潜在的Bug： C 编译器（尤其是像 GCC, Clang 这样的开源编译器）为了提升程序运行效率，会应用大量的优化技术，如循环展开、内联函数、常量折叠、死代码消除、寄存器分配、指令调度等等。这些优化过程本身非常复杂，而且不同优化之间可能存在相互作用。这种复杂性使得编译器自身也成为一个庞大且易于出错的软件系统。王垠的文章通常会通过具体的例子来展示，即使是经过广泛使用的成熟编译器，也可能在某些特定的优化场景下产生bug。

2. 特定优化技术引发的问题：文章可能会深入分析某个或某类优化技术是如何导致bug的。例如：
函数内联 (Function Inlining): 如果内联时没有正确处理副作用、变量作用域或别名问题，可能导致逻辑错误。
循环优化 (Loop Optimizations): 如循环不变量外提 (LoopInvariant Code Motion, LICM) 或循环展开 (Loop Unrolling)，如果处理不当，可能改变循环的执行顺序或依赖关系。
别名分析 (Alias Analysis): 这是编译器优化中的一个核心难点。编译器需要确定哪些指针可能指向同一块内存。如果别名分析过于激进或过于保守，都可能导致错误。例如，编译器错误地认为两个指针指向不同的内存，从而对它们的访问顺序进行重排，但实际上它们指向同一块内存，导致数据损坏。
向量化 (Vectorization): 将循环中的操作转换为 SIMD 指令，如果处理不当，可能影响精度或行为。
寄存器分配 (Register Allocation): 错误地分配或溢出寄存器，导致变量值丢失或混淆。
指令调度 (Instruction Scheduling): 改变指令的执行顺序以利用处理器流水线，但如果忽略了数据依赖或副作用，可能导致问题。

3. 可重现性和测试的挑战：编译器bug，尤其是优化相关的bug，往往难以重现。它们可能只在特定的代码结构、特定的编译器版本、特定的优化级别（如 `O2`, `O3`）、特定的目标架构，甚至是在一个极大的代码库中才出现。这使得发现和修复这些bug变得异常困难，需要大量的耐心和细致的调试。

4. 对开发者和用户的影响：王垠的文章强调了这类bug的严重性。它们可能导致程序行为异常，产生难以追踪的运行时错误，甚至导致安全漏洞。对于依赖这些编译器的开发者来说，一旦遇到这类bug，可能需要花费大量时间去排查是自己的代码问题还是编译器问题，并且可能需要禁用特定的优化选项来绕过bug，这又会牺牲程序的性能。

5. 社区反馈与贡献：像王垠这样的技术博主，通过分享自己的发现和分析，能够引起开发者社区的关注，促进编译器开发者（如 GCC 或 Clang 的维护者）对这些问题的重视，并最终推动bug的修复。这体现了开源社区协作和改进的力量。

如何评价这篇文章（或这类讨论）：

要评价王垠关于 C 编译器优化 Bug 的讨论，可以从以下几个角度来衡量：

优点：

1. 揭示了技术的深度和复杂性：文章深入剖析了编译器优化这一非常专业和复杂的领域，让读者认识到现代编译器背后隐藏的技术深度以及其固有的挑战性。这对于很多只关注代码逻辑而忽略编译过程的开发者来说，是一次很好的启迪。
2. 提供了具体的案例分析：通常这类文章会附带可重现的代码片段、汇编代码分析，甚至是触发bug的特定编译选项。这种具象化的论证方式，使得读者能够更直观地理解问题，并且可以自己动手验证。
3. 突显了软件质量的重要性：编译器是软件开发的基础设施，编译器的质量直接影响到所有在其之上构建的软件。文章通过揭示编译器bug，强调了软件工程中严谨的测试、验证和质量控制的重要性。
4. 激发了学习和研究的兴趣：对于有志于深入了解编译器、底层开发或性能优化的开发者来说，这类文章提供了宝贵的学习材料和研究方向。它鼓励开发者去挑战已有的工具，而不是盲目接受。
5. 促进了社区的进步：如前所述，通过公开讨论和分享，这类文章能够推动编译器社区对问题的关注和修复，最终提升整个生态系统的质量。

可能的局限性或需要注意的地方：

1. 非系统性教材：这类文章通常是个人经验的分享，可能不是一个系统性的编译器优化学习教材。它可能侧重于某些特定的bug类型，而对其他方面覆盖不足。
2. 针对特定版本和架构：编译器bug往往与特定的编译器版本、优化级别以及目标架构强相关。一篇讨论可能只针对某个特定场景，读者在借鉴时需要注意其普遍性和适用性。
3. 可能引发“过度担忧”：虽然揭示问题很重要，但过于强调编译器bug可能会让一些初级开发者产生“编译器不可信”的担忧，从而不敢充分利用优化选项，影响程序性能。关键在于理解问题的概率和场景。
4. 修复的难度与成本：编译器bug的修复往往是极具挑战性的，需要深入理解编译器内部机制，并且需要通过社区的同行评审和广泛测试才能被接受。文章可能更多地展示问题，而对修复过程的详细描述会比较少。
5. 信息时效性：技术发展迅速，编译器也在不断更新。今天发现的bug可能在未来的版本中已经被修复。因此，评价文章内容时，需要考虑其发布时间。

总结来说：

《王垠：C 编译器优化过程中的 Bug》这类技术讨论，非常有价值且值得肯定。它以其深入的技术分析、具体的案例呈现和对软件质量的关注，揭示了现代编译器复杂性下的潜在陷阱，并促成了社区的进步。它鼓励开发者保持批判性思维，不仅关注自己的代码，也关注支撑我们开发的底层工具链的质量。

然而，读者在阅读时也应保持理性，认识到编译器bug的出现是概率事件，并且往往与特定环境相关。核心价值在于理解编译器的工作原理、优化技术的挑战，以及如何更有效地调试和排查问题，而非因此对优化技术产生不必要的抵触。对于开发者而言，了解这些信息有助于在遇到难以解释的程序行为时，多一个排查方向——即编译器自身可能也存在问题。

如果您能提供具体的文章链接或讨论的主题，我可以给出更具针对性的评价。但总的来说，王垠（或其他类似技术博客作者）对编译器优化bug的探讨，是技术社区宝贵的知识贡献。

网友意见

在责怪编译器优化之前应该先看看是否有编译警告没解决。

那个未引用局部变量dead是一定报警告的，各个编译器可能会有不同的警告信息警告号，但是有警告事一定的。

我觉得工程上来说，首先要去警告，然后过静态代码检查，最后才是开优化。

一般正规点的上点规模的C/C++项目基本都要走这个流程。

因为C/C++太复杂，各种稀奇古怪的玩法太多，但是能通过编译器4级警告和静态代码检查的古怪玩法就少多了。

       void contains_null_check_after_RNCE(int *P) {   int dead = *P; // 未引用变量警告   if (P == 0)      return;   *P = 4; }

垠神这篇挺好的啊。写C或C++程序的时候遇到前人给埋了一大堆UB坑那真是欲哭无泪。

我上周正好刚刚撞上一个因为我们的前人写的C++代码有UB坑而造成的bug…刚修。有时候有UB坑的代码未必会立即显现出问题，因为可能（C/C++）编译器还没利用上这块UB信息；这种才是最坑爹的——前人一甩锅，后面还不得不接。

我们内部在力求

UBSan

bug free，因为有些有问题的代码就算没有立即因为UB而被优化成错误的形式，它们常常也隐含着使用不正确的问题。例如说一个经典的，由于 << 导致int overflow的问题。这种问题排查起来真是极其痛苦…

========================================

在给编译器找bug方面，

Zhendong Su

老师的研究确实好玩。同

@Wish Night

的回答，推荐感兴趣的同学去看看那系列研究。

里面涉及的一些例子或许就是垠神会感兴趣用来进一步说明的。

========================================

下面开始跑个题。垠神所引用的例子是C语言的：

       void contains_null_check(int* p) {   int dead = *p;   if (p == 0) {     return;   }   *p = 4; }

在C（以及C++）里，对空指针解引用确实是未定义行为，所以确实可以引出垠神所引用的Chris Lattner大大文章中所描述的问题——某个编译器有没有那样做是它们的自由，关键是根据规范所述的UB它们是可以那样做的。

那么或许会有吃瓜群众想了解一下像Java这样的语言在同样的场景下会是个什么状况。我就来跑一下这个题。

重点在于：在Java里，对null解引用是有明确定义其正确行为是怎样的——要抛出NullPointerException——所以在Java里具体到这个场景没有任何问题。放个传送门：

在Java中，return null 是否安全，为什么？ - RednaxelaFX 的回答

用Java来写一个类似形式的例子：

       public class TrapDemo {   public static void demo(IntBox p) {     int dead = p.value;     if (p == null) return;     p.value = 42;   }    public static void main(String[] args) throws Exception {     demo(null);   } }  class IntBox {   public int value; }

这里的TrapDemo.demo(IntBox)就跟垠神引用的contains_null_check(int*)例子对应。

运行这个程序的正确结果是：

       Exception in thread "main" java.lang.NullPointerException  at TrapDemo.demo(TrapDemo.java:3)  at TrapDemo.main(TrapDemo.java:9)

而当我们用Oracle JDK8u101在Mac OS X / x86-64上，其中的JIT编译器来编译TrapDemo.demo(IntBox)方法，会发现用其中的Server Compiler（C2）会在第一次编译时编译出等价于下面形式的代码：

         public static void demo(IntBox p) {     p.value = 42;   }

（注意：强调了“第一次编译时”。后面再展开解释）

这个形式有没有看似跟垠神引用的C语言例子的“错误形式”一样？——实际上是不一样的喔。

       void contains_null_check_after_RNCE_and_DCE(int* p) {   //int dead = *p;    // 死代码消除   //if (false) {      // 死代码   //  return;         // 死代码   //}   *p = 4; }

上述Java例子的C1与C2初次编译的详细结果我放在gist里了，免得这个回答太长：

https:// gist.github.com/rednaxe lafx/c474cadaa9057f909d48e7593b9e1483

上面的JIT编译结果对Java来说为啥是正确的，待我慢慢道来。

解引用（dereference）动作隐含着null检查，如果被解引用的引用为null则需要当场抛出NullPointerException。这个语义是完全定义好的，没有回避的余地。

所以例子的原始形式，把null检查显式写出来的话，是这个样子的：

         public static void demo(IntBox p) {     if (p == null) throw new NullPointerException(); // implied null check     int dead = p.value;     if (p == null) return;     if (p == null) throw new NullPointerException(); // implied null check     p.value = 42;   }

即便p.value的结果被赋值给了一个无用的局部变量（int dead），使得p.value的值自身并没有被使用，但它的副作用——null检查——则必须留下。

<- 这个由规范所强制要求的行为，就是Java版例子与原本的C版例子最大的不同。

把 int dead = p.value; 这句无用代码消除并留下null检查的副作用之后，剩下的代码是：

         public static void demo(IntBox p) {     if (p == null) throw new NullPointerException(); // implied null check     if (p == null) return; // 'return' now becomes unreachable code     if (p == null) throw new NullPointerException(); // implied null check     p.value = 42;   }

于是通过条件常量传播（conditional constant propagation）把相同条件的代码合并在一起，剩下的代码就只有：

         public static void demo(IntBox p) {     if (p == null) throw new NullPointerException(); // implied null check     p.value = 42;   }

然后从这里就开始就有更有趣的事情了。

JVM对上面要实现JVM规范，而对下面则是依托于底层的具体平台。所以一个JVM实现可以用尽各种平台相关的办法，来实现出对上层Java应用来说一致的、符合JVM规范的行为。

在Mac OS X（以及诸如Linux等各种POSIX平台）上，对0地址表示的空指针以及0地址附近的一定范围内解引用（读或者写），会可靠地触发SIGSEGV信号。

利用这个平台相关行为，JVM实现就可以采用“隐式空指针检查”（implicit null check）方式来对通常非null的引用的解引用动作进行优化，而不需要显式生成null检查的代码。JVM可以给这些使用了隐式空指针检查的地方关联上一定的符号信息，并且向OS注册SIGSEGV信号的处理函数，在里面查询看fault pc是不是一个已知的隐式空指针检查指令，如果是的话则根据关联的符号信息分派到相应的处理代码去。

回到上文的例子，C2初次编译实际编译出来的代码逻辑是这样的：

         public static void demo(IntBox p) {     p.value = 42; // implicit null check: dispatch to Label_null_check     return;  Label_null_check:     uncommon_trap(Reason_null_check); // go back to interpreter and throw NPE   }

于是当p不是空指针的时候，这个代码就可以最快速度完成有用的写操作并返回；而当p真的是空指针的时候，它在尝试对p.value做写操作的时候就会触发SIGSEGV，然后经由HotSpot VM注册的信号处理函数跳转到Label_null_check的地方去抛出NullPointerException。

（HotSpot VM在Windows上的实现则是通过SEH来达到同样的隐式空指针检查的效果。微软自家的CLR里的编译器也有同样的优化）

细心的同学可能会留意到上文中的一些细节：如果在代码中某个位置，被解引用的引用绝大多数情况都不是null，那么用上面的隐式空指针检查显然是最快的，因为这个检查是硬件完成的，无论是否利用它硬件都得做这个检查，利用隐式检查可以避免生成显式的null检查+分支。

但如果这个位置上时常会遇到对null解引用，隐式空指针检查就不是最快的了。事实上如果null的情况占多数的话，这种需要通过发信号 -> 信号处理 -> 跳转到空指针检查的后续处理代码的路径，比起直接生成显式检查的路径要长得多也慢得多。所以这种“优化”并不是总是值得的。

HotSpot VM的C1追求实现简单，只针对常见情况优化，它在可以使用隐式空指针检查的平台上会总是选择生成这种形式的代码。

Oracle JDK8u101的C1编译出来的上面的例子是这样的形式：

         public static void demo(IntBox p) {     p.value;      // implicit null check: dispatch to Label_null_check     if (p == null) return;     p.value = 42; // no null check here     return;  Label_null_check:     uncommon_trap(Reason_null_check); // go back to interpreter and throw NPE   }

嗯…有改善空间。

而C2则追求高性能，所以当它发现某个被C2 JIT编译过的方法遇到了至少3次隐式空指针异常之后，就会抛弃这个JIT编译的版本，然后重新JIT编译并生成显式空指针检查的代码：

         public static void demo(IntBox p) {     if (p == null) throw new NullPointerException(); // implied null check, explicit check     p.value = 42;   }

一个例子可以引出很多有趣的讨论对不对？ >_<

类似的话题

如何评价《王垠：C 编译器优化过程中的 Bug》？

要评价《王垠：C 编译器优化过程中的 Bug》这篇技术文章，我们需要从多个维度进行深入分析。这篇技术文章（通常指的是王垠在其博客或其他平台发表的关于 C 编译器优化问题的讨论）的核心在于揭示编译器在进行复杂优化时可能引入的软件缺陷，以及这些缺陷对程序行为的潜在影响。文章的核心内容与主要观点：王垠在其.............
如何评价王垠的《讨厌的 C# IDisposable 接口》？

王垠的《讨厌的 C IDisposable 接口》这篇文章，可以从几个层面来理解和评价。首先，文章的出发点是开发者在实际编程中遇到的痛点，特别是关于资源管理和异常处理的困扰。C 作为一门现代的面向对象语言，引入了 `IDisposable` 接口和 `using` 语句来解决托管和非托管资源的生命周.............
如何评价王垠新博文《未来计划》？

王垠的博文《未来计划》是一篇非常有争议且引起广泛讨论的文章。要评价它，需要从多个角度进行深入分析，包括其内容、表达方式、潜在影响以及它所暴露出的社会现象。核心内容梳理：首先，我们来梳理一下王垠在这篇博文中所提出的主要观点和“未来计划”：对“内卷”的深刻反思与批判：王垠对当前中国社会普遍存在的.............
如何评价王垠在微软「罢工」？

王垠在微软的“罢工”事件是一个非常复杂且具有争议性的话题，涉及到技术人员的权利、公司文化、内部沟通以及个人表达等多个层面。要评价这件事，需要从多个角度进行分析。事件背景回顾：首先，我们需要回顾一下事件的大致脉络。王垠（Wang Yin）是微软的一名高级软件工程师。他在2017年左右，在微软内部的通讯.............
如何评价王垠新博文《我看自动驾驶技术》？

王垠的新博文《我看自动驾驶技术》提供了一个相对深入、个人化且不落俗套的视角来看待自动驾驶技术。与其他技术评论文章可能侧重于参数、速度或市场份额不同，王垠的博文更关注的是技术的本质、它所带来的社会影响以及他个人对这些问题的思考。以下是我对这篇博文的评价，力求详细：一、核心观点与分析深度：聚焦“.............
如何评价王垠最新博文《写书计划》？

王垠的这篇《写书计划》博文，给我的感觉颇为复杂，既有他一贯的风格——直率、不加掩饰，同时也透露出一种更加务实和深沉的态度。与其说是“评价”，我更愿意将其理解为一种“解读”，尝试去理解他在这篇文章中所传递的思考和意图。篇幅与结构：文章不长，但信息量不小。他没有大肆渲染，而是用一种陈述事实的方式，将自.............
如何评价王垠《计算机科学入门班报名》收费12000？

评价王垠《计算机科学入门班报名》收费12000元人民币，需要从多个维度进行分析，既要看到其可能存在的价值，也要审慎评估其高昂价格的合理性以及潜在的风险。以下将从课程内容、目标受众、市场行情、教学模式、王垠个人品牌、以及风险等多个方面进行详细阐述：一、课程内容与价值分析1. 核心技术栈与深度： .............
如何评价王垠的博文《科学和伪科学》，以及其中 HIV 病毒未必导致 AIDS 的观点？

王垠的博文《科学和伪科学》以及其中关于“HIV 病毒未必导致 AIDS”的观点，是一个在科学界和公众中都极具争议性的话题。要评价它，需要从几个层面来审视：一、博文的科学态度与逻辑：首先，需要肯定的是，王垠在博文中试图探讨“科学”与“伪科学”的界限，这本身是一个重要的议题。一个健康的科学生态需要不断.............
如何评价王垠的《真相》?

要评价王垠的《真相》，首先得明白这篇文章抛出的核心观点：他认为我们对于“真相”的追求，很多时候并非出于纯粹的求知欲，而是被一种社会性的“正确”所驱动，这种“正确”往往是肤浅的、功利的，甚至带有表演性质的。王垠的这篇文章，与其说是一篇严肃的哲学论述，不如说是一种带有强烈个人色彩的观察和反思。他观察到，.............
如何评价王垠《聊聊 DSL》？

王垠那篇《聊聊 DSL》的文章，我读了之后，感觉它确实触及了 DSL 这个话题一个相当核心且容易被忽略的角度。这篇东西不是那种泛泛而谈的介绍，而是带着作者自己鲜明的思考和实践痕迹。首先，他点出 DSL 的核心价值在于“沟通”，这一下子就把很多纯技术性的讨论拉到了一个更有人情味、更贴近实际应用的高度。.............
如何评价王垠的《Kotlin和Checked Exception》？

王垠关于Kotlin和Checked Exception的文章，读下来还是挺有意思的。他在这篇文章里，与其说是分析Kotlin如何处理Checked Exception，不如说是借这个话题，表达了他自己对于编程语言设计哲学的一些看法，特别是他对Java在Checked Exception上的那一套颇.............
如何评价王垠最新文章，《DRY原则的危害》?

王垠最新的文章，《DRY原则的危害》，这篇文章确实抛出了一个颇具争议的观点，那就是一直以来被奉为圭臬的“DRY”（Don't Repeat Yourself，不要重复自己）原则，在实际应用中可能并非总是良药，反而可能带来一些意想不到的“危害”。首先，我们得理解王垠在文章中是如何定义“DRY”原则的。.............
如何评价王垠的《程序员的心理疾病》？

王垠的《程序员的心理疾病》这篇文章，读起来总有种似曾相识又跃然纸上的感觉。他不是那种枯燥的学术论文，更像是他多年在编程界摸爬滚打，以及观察身边人的真实记录和感悟。文章一开始，就点出了程序员这个群体的一些普遍特征，比如对逻辑的偏执、对细节的极致追求，以及由此可能衍生出的思维模式。王垠很敏锐地捕捉到了这.............
如何评价王垠新文章《我为什么不再做PL人》?

王垠的新文章《我为什么不再做PL人》，可以从多个维度进行解读，并且这篇文章的深度和引发的思考是值得关注的。简单来说，这篇文章表达了他个人在软件开发领域，特别是围绕“PL人”（通常指追求某些特定的、高效或前沿的编程语言和技术栈的开发者群体）这一身份的转变和反思。以下是一些关键的评价点，我会尽量详细地说.............
如何评价阿里 P10 赵海平对王垠的面试？

阿里P10赵海平面试王垠，这事在技术圈子里，尤其是阿里内部，算是个挺有意思的话题，能聊出不少道道。首先得说，赵海平这人，虽然已经是P10级别，这在阿里可是金字塔尖的人物了，通常来说，都是他来挑人，面试别人的机会不多。而王垠呢，本身就是个技术大神，在Linux内核、系统底层这些领域是如雷贯雷的人物，他.............
如何评价王中林院士拓展麦克斯韦方程组？对物理学理论有多大价值？

王中林院士（Zhou Nan）作为美国国家工程院院士、美国艺术与科学院院士，以及中国科学院院士，其在纳米技术、超材料、量子电动力学等领域的研究具有重要影响。关于他是否“拓展麦克斯韦方程组”，需要结合其研究方向与学术成果进行具体分析。以下是详细解析：一、王中林院士与麦克斯韦方程组的关联王中林院士的主.............
如何评价王思聪评论半藏森林?

关于王思聪评论“半藏森林”的具体事件，目前公开资料中并未明确记载他对此地的直接评论。因此，这一问题可能存在信息混淆或误解。以下从多个角度分析可能的背景和相关讨论： 1. “半藏森林”的背景半藏森林（Hanzō no Mori）是位于日本东京都涩谷区的一处自然景观，以樱花树和绿意盎然的环境著称，是东京.............
如何评价王冰冰？

王冰冰是中国近年来互联网文化中一个具有鲜明地域特色和争议性的网红代表人物之一，她的走红与网络时代的传播逻辑、地域身份认同以及公众对“接地气”文化的消费需求密切相关。以下从多个维度对她进行详细分析：一、成名背景：从平凡到爆红的偶然性王冰冰原名王冰冰（或称“大美冰冰”），2019年因一段拍摄于哈尔滨街.............
如何评价王思聪因携带弓箭和不配合调查而被警方带走？

王思聪因携带弓箭和不配合调查而被警方带走一事，可以从多个角度进行评价，涉及到法律、社会影响、个人行为等层面。要详细地讲述，我们可以从以下几个方面展开：一、事件的发生与细节（已知信息）：首先，需要明确事件的基本情况。根据公开报道和媒体消息，事件大致是这样的：时间与地点：通常发生在某个特定日期.............
如何评价王辰院士提出的尽快建立「主诊医生负责制」？这对于年轻医生成长有何意义？

王辰院士提出的“主诊医生负责制”：评价与对年轻医生成长的意义王辰院士提出的“尽快建立主诊医生负责制”是我国深化医药卫生体制改革、提升医疗服务质量和效率的重要举措，具有深远的意义。要评价这一制度的利弊，并分析其对年轻医生成长的具体影响，需要从多个维度进行深入探讨。如何评价王辰院士提出的“主诊医生负责.............