【C语言】编译与链接全揭秘：从源代码到可执行文件-线上365bet正网-线上365bet正网-体育在线365下载-附近的36524超市

C语言学习前言：在编程的世界里，我们编写的C语言代码并非计算机能够直接理解的指令。本文将带您深入探索C程序从源代码到可执行文件的完整转换过程，揭示编译和链接背后的奥秘。

一、翻译环境和运行环境在ANSI C的任何⼀种实现中，存在两个不同的环境

第1种是翻译环境，在这个环境中源代码被转换为可执行的机器指令（⼆进制指令）。

第2种是执行环境，它用于实际执行代码。

在这里插入图片描述我们就来看一下每一步都干了什么。

二、翻译环境翻译环境是将程序员可读的C语言源代码转换为计算机可执行的机器指令的关键过程。这个过程可以划分为两个主要阶段：编译阶段和链接阶段，其中编译阶段又可进一步细分为三个子过程：预处理（有些书也叫预编译）、编译、汇编三个过程。

在这里插入图片描述

对于⼀个C语言的项目中可能有多个.c文件⼀起构建，那多个.c文件如何生成可执行程序呢？

多个.c文件单独经过编译器，编译处理生成对应的目标文件。

注：在Windows环境下的目标文件的后缀是.obj，Linux环境下目标文件的后缀是.o。

多个目标文件和链接库⼀起经过链接器处理生成最终的可执行程序。

链接库是指运行时库(它是支持程序运行的基本函数集合)或者第三方库。

如果再把编译展开成3个过程，那就变成了下面的过程：

在这里插入图片描述2.1 预处理（预编译）在预处理阶段，源文件和头文件会被处理成为.i为后缀的文件。

预处理阶段主要处理那些源文件中#开始的预编译指令。比如：#include,#define，处理的规则如下：

• 将所有的 #define 删除，并展开所有的宏定义。

• 处理所有的条件编译指令，如：#if、#ifdef、#elif、#else、#endif。

• 处理#include 预编译指令，将包含的头文件的内容插入到该预编译指令的位置。这个过程是递归进行的，也就是说被包含的头文件也可能包含其他文件。

• 删除所有的注释

• 添加行号和文件名标识，方便后续编译器生成调试信息等。

• 或保留所有的#pragma的编译器指令，编译器后续会使用。

经过预处理后的.i文件中不再包含宏定义，因为宏已经被展开。并且包含的头文件都被插入到.i文件中。所以当我们无法知道宏定义或者头文件是否包含正确的时候，可以查看预处理后的.i文件来确认。

2.2编译编译过程就是将预处理后的文件进行⼀系列的：词法分析、语法分析、语义分析及优化，生成相应的汇编代码文件。

以下面代码为例进行编译，分析其过程：

代码语言：javascript复制array[index] = (index+4)*(2+6);2.2.1 词法分析将源代码程序被输入扫描器，扫描器的任务就是简单的进行词法分析，把代码中的字符分割成⼀系列

的记号（关键字、标识符、字面量、特殊字符等）。

上面程序进行词法分析后得到了16个记号。

记号

类型 )

array

标识符

[

左方括号

index

标识符

]

右方括号

赋值运算符

(

左圆括号

index

标识符

加号运算符

数字常量

)

右圆括号

乘号运算符

(

左圆括号

数字常量

加号运算符

数字常量

)

右圆括号

2.2.2 语法分析接下来语法分析器，将对扫描产生的记号进行语法分析，从而产生语法树。这些语法树是以表达式为节点的树。

在这里插入图片描述2.2.3 语义分析由语义分析器来完成语义分析，即对表达式的语法层面分析。编译器所能做的分析是语义的静态分析。静态语义分析通常包括声明和类型的匹配，类型的转换等。这个阶段会报告错误的语法信息。

2.3 汇编汇编器是将汇编代码转转变成机器可执行的指令，每⼀个汇编语句几乎都对应⼀条机器指令。就是根

据汇编指令和机器指令的对照表⼀⼀的进行翻译，也不做指令优化。

2.4 链接链接是⼀个复杂的过程，链接的时候需要把⼀堆文件链接在⼀起才生成可执行程序。

链接过程主要包括：地址和空间分配，符号决议和重定位等这些步骤。

链接解决的是⼀个项目中多文件、多模块之间互相调用的问题。

举例：

在⼀个C的项目中有2个.c文件（test.c 和 Add.c）

在这里插入图片描述

我们已经知道，每个源文件都是单独经过编译器处理生成对应的目标文件。

test.c 经过编译器处理生成 test.o

Add.c 经过编译器处理生成 Add.o

我们在test.c的文件中使用了Add.c文件中的Add函数和val变量。

我们在test.c文件中每⼀次使用Add函数和val的时候必须确切的知道Add和val的地址，但是由于每个文件是单独编译的，在编译器编译test.c的时候并不知道Add函数和 val变量的地址，所以暂时把调用Add的指令的目标地址和val的地址搁置。等待最后链接的时候由链接器根据引用的符号Add在其他模块中查找Add函数的地址，然后将test.c中所有引用到Add 的指令重新修正，让他们的目标地址为真正的Add函数的地址，对于全局变量val也是类似的方法来修正地址。这个地址修正的过程也被叫做：重定位。

三、运行环境程序必须载入内存中。在有操作系统的环境中：⼀般这个由操作系统完成。在独立的环境中，程序的载入必须由手工安排，也可能是通过可执行代码置入只读内存来完成。程序的执行便开始。接着便调用main函数。开始执行程序代码。这个时候程序将使用⼀个运行时堆栈（stack），存储函数的局部变量和返回地址。程序同时也可以使用静态（static）内存，存储于静态内存中的变量在程序的整个执行过程⼀直保留他们的值。终止程序。正常终止main函数；也有可能是意外终止。总结以上我只是非常简洁的阐述了⼀个C的程序是如何编译和链接，到最终生成可执行程序的过程。想让大家对编译和链接有个了解。而对很多内部的细节并没有展开讲解。后续会再继续深入讲解。

谢谢学习至此！！！

后续预告：

下篇文章将深入探讨预处理阶段的细节，包括宏展开、条件编译等高级主题。

【C语言】编译与链接全揭秘：从源代码到可执行文件

相关文章

mix2玩王者荣耀的感受，硬伤太大了

手机里安卓应用突然“罢工”？揭秘停止运行程序背后的真相

honey select再出新版 honey select豪華典藏版V23下載

友情链接