百科问答小站 logo
百科问答小站 font logo



汇编语言转换成机器语言,具体在机器这个层面是如何实现的? 第1页

  

user avatar   s.invalid 网友的相关建议: 
      

不考虑宏汇编的话,大概是这个样子:

       map<string, string> 助记符到指令码 = {    {"nop", "90"},    {"mov", "56"},    {"$1", "00$1"},    {"[$1]", "01$1"},    ... }      

然后你就可以写汇编程序了:

       nop nop mov ax,bx mov [ax],bx     

然后就是依照那个map做简单的字符串替换了。比如见了nop就替换成16进制的90,见了mov就替换成16进制的56;后面的ax/bx在指令中替换成寄存器地址即可;参数带不带中括号意味着它是指针访问还是直接取值,所以要酌情加不同的指示标志(比如我杜撰的这种语言,00是作为值直接访问,01就是当成地址间接访问)……


注意,不同汇编器支持的助记符写法风格不同。你完全可以自己随便约定。另外,不同CPU的指令构成也不尽相同,你也要自己抓住其中的规律,然后总结出字符串替换规则——但总而言之就是字符串替换而已,没什么特别的。


当然,不同系统可能会规定不同的可执行文件格式。比如Linux系统和Windows系统就不一样;当年dos系统下的command文件和exe也不相同。

总的来说,你需要按照人家的规矩填充一个叫“文件头”的数据结构,然后按规矩在正确位置放置第一条指令(的机器码);此外,你可能需要为“重定位”支持稍微多做一点小小的工作、并且算一算标号(label)的相对地址,再把它替换进相关指令中。


但归根结底,汇编到机器语言基本就是一个字符串替换的工作,没什么神秘的——编译原理这种大杀器在“高级语言编译到汇编”这种场景才能派上用场,汇编器这种小打小闹还用不着它。




  

相关话题

  为什么编程语言语法的设计不往缩小与自然语言的差别的方向发展,或者说在这个方向发展得这么慢呢? 
  为什么8086CPU不支持将数据直接送入段寄存器的操作? 
  编程语言和牛顿定律哪一个对人类的意义更大? 
  为什么我写代码时总是手滑把main打成mian? 
  程序在编译的时候,会转换成汇编,然后是机器指令,那么运行的时候,操作系统充当什么呢? 
  为什么有人会排斥用苹果电脑? 
  CPU 的指令集存放在什么地方? 
  为什么国家将加快人工智能研究生培养?又为什么很多研究生评论人工智能是个大坑呢? 
  利用无理数压缩数据是否可行? 
  有没有比图灵机能力更强的计算模型? 

前一个讨论
为什么在汇编语言中需大量使用跳转指令,而在C语言中却尽量避免使用goto语句呢?
下一个讨论
野生动物直接喝浑浊的脏水都没事,为什么人类不行?





© 2025-05-14 - tinynew.org. All Rights Reserved.
© 2025-05-14 - tinynew.org. 保留所有权利