这东西。。可难可简单
0. brainfuck
模拟就完事了
1. 词法语法分析完得ast
ast解释,这是玩具语言的选择。
ast生成汇编,然后汇编器产出具体架构的机器代码,这是玩具语言的选择。
2. 分析完得字节码然后套vm执行
语法分析完后也可能有语义检查或者其他啥的,这是c4,red,lua的选择。
2. ast转字节码,或者1直接产出字节码,供以vm模拟字节码行为
这也是解释器,线性分派以及局部性因素可能让它比较快,但是,到这一步大概率你会加上GC,runtime等各种组件,除非你用的宿主语言本身就是GC语言,那么可以省略GC实现,但是runtime等仍然不可少。这是cpython,php,gravity的选择。
3. vm不直接模拟宿主执行字节码,而是在早期将每一条字节码翻译为机器代码,然后vm执行这些机器代码
即jit的过程,是指运行时生成可实现代码的过程,这样比2快。也是个解释的过程。这是luajit,php jit的选择。
4. ast或者字节码转成一种ir,对ir应用些优化,然后lowering,再汇编器出机器代码
可以是ast转成ssa做各种opt pass,然后lowering到平台相关,最后汇编器生成机器代码。这是golang的选择。red也准备这样,但是ir不知道是不是ssa。
100. ast或者字节码转多级别ir,各级别ir都应用优化,然后lowering,最后汇编出机器代码
现代编译器的设计。比如gcc,jvm的c1 c2 ,graal,llvm backend,v8的crankshaft turbofan等,都属于地表最强编译器俱乐部。
还有些不走寻常路以及没提到的以及我不知道流程的,待补充。
不过,结论大致是只学完c语言语法写不出编译器,但是简单的解释器你可以!!