编译原理 —— 1.1 什么是编译

tech2024-08-04 109

1、计算机程序设计语言

计算机程序设计语言分为三个层次：

机器语言：可以被计算机直接理解的语言；

计算机只能直接理解0和1的数字，因此由机器语言编写的程序都是由1和0这两个数字构成的序列，“C706 0000 0002”就是一条机器语言的指令，这里使用的是十六进制的形式，C706是这条指令的操作码，表示移路操作，0000和0002是两个操作数，这条指令表示将数值2存放到地址0000；

机器语言与人类表达习惯相去甚远，程序员需要记住各个操作码代表什么操作，这些特点使得用机器语言编写和阅读程序都是十分困难的，而且经常容易写错，于是很快出现了汇编语言；

汇编语言

汇编语言中引入了助记符，例如“MOV X,2”是汇编语言的一条指令，指令中的MOV就是一个助记符，表示移路的意思，假设X表示地址0000，这条指令和机器语言中的指令“C706 0000 0002”完成了一样的功能，但是由于汇编语言引入了助记符，所以汇编语言更加直观，虽然取得了一定进步，但是汇编语言依赖于特定机器，程序员需要熟悉目标机的特性，这对于非计算机专业人员来说使用上很受限制，而且汇编语言的编写效率依然很低，即使是比较简单的表达式也需要好几条指令，于是后来就出现了高级语言；

高级语言

高级语言以一种类似于数学定义或者自然语言的简介形式来编写程序，例如某高级语言的一条语句"x=2"，其完成了和汇编语言中的“MOV X,2”或者机器语言中“C706 0000 0002”相同的功能；可以看出高级语言更接近人类表达习惯，而且不依赖于特定机器，编写效率高；

高级语言和汇编语言的程序最终都要翻译成由0和1构成的机器代码才能在计算机上执行，将汇编语言翻译成机器语言的过程称为汇编，将高级语言翻译成汇编语言或者直接翻译成机器语言的过程就称为编译；

编译的本质是将高级语言翻译成汇编语言或者机器语言的过程；前者（高级语言）称为源语言，后者（汇编语言或者机器语言）称为目标语言；

编译原理这门课就是学习编译器的构成原理和相关技术，也就是编译器如何将高级语言自动翻译成汇编语言或者机器语言的

2、编译器在语言处理系统中的位置

为了建立可执行的目标程序，除了编译器还需要其他的一些程序，首先需要一个预处理器；

源程序可能被分割成多个模块存放在不同的文件中，预处理器负责把存储在不同文件中的源程序聚合在一起，并且负责把被称为宏的缩写语句转换为原始语句；

经过预处理的源程序经过编译器和汇编器的处理之后生成可重定位的机器代码，可重定位是指生成的机器代码在内存中存放的起始位置不是固定的，代码中的所有地址都是相对于起始地址L的相对地址；

$起始地址 + 相对地址 = 绝对地址$

为了得到绝对地址，需要链接器/加载器修改可重定位地址，将修改后的指令和数据放到内存中适当的位置；

大型程序经常被分割成多个部分进行编译，因此可重定位的机器代码需要和其它可重定位目标程序以及库文件进行链接生成可执行代码，这一工作是由链接器来完成的，链接器的作用是将多个可重定位的机器代码文件（包括库文件）连接到一起，链接器还负责解决外部内存地址问题，外部内存地址是指文件中代码可能会使用另一个文件中的数据对象或者过程，那么这些数据对象和过程地址相对于当前文件来说就是外部内存地址；

最新回复(0)