第七周可执行程序的卸载

一.预处理,编译,链接和目标文件的格式

可执行程序是怎么得来的:

预处理负责把include的文件包含进来及宏替换等工作

可执行文件的创建——预处理、编译和链接:

目标文件的格式ELF:A.out-->COFF-->PE/ELF

ABI&目标文件格式:

一个可重定位保存着代码和适当的数据,用于和其他的object文件一起来创建一个可执行文件或是一个共享文件(主要是.o文件)

一个可执行文件保存着一个用来执行的程序,该文件指出exec(BA_OS)如何来创建程序进程映像(主要是.so文件)

当创建或增加一个进程映像的时候,系统理论上将拷贝一个文件的段到一个虚拟的内存段

一般静态链接会将所有代码放在一个代码段,动态链接的进程会有多个代码段

二.可执行程序,共享库和动态链接

可执行程序的执行环境

命令行参数和shell环境，一般我们执行一个程序的Shell环境即execve系统调用。

$ ls -l /usr/bin 列出/usr/bin下的目录信息
Shell本身不限制命令行参数的个数，命令行参数的个数受限于命令自身

例如，int main(int argc, char *argv[])
又如， int main(int argc, char *argv[], char *envp[])

Shell会调用execve将命令行参数和环境参数传递给可执行程序的main函数

int execve(const char * filename,char * const argv[ ],char * const envp[ ]);
库函数exec*都是execve的封装例程

命令行参数和环境变量如何保存和传递:环境串都放在用户态堆栈中

三.可执行程序的卸载

命令行参数和shell环境，一般我们执行一个程序的Shell环境，我们的实验直接使用execve系统调用。
sys_execve内部会解析可执行文件格式

四.实验

要求:使用gdb跟踪sys_execve内核函数的处理过程，分析exec*函数对应的系统调用处理过程，理解Linux内核如何装载和启动一个可执行程序。

shell终端，执行以下命令：

cd LinuxKernel

rm -rf menu

git clone https://github.com/mengning/menu.git

cd menu

mv test_exec.c test.c

make rootfs

可以看到启动后的MenuOS已经包含了exec命令

可以通过增加-s -S启动参数打开调试模式

qemu -kernel ../linux-3.18.6/arch/x86/boot/bzImage -initrd ../rootfs.img -s -S

打开gdb进行远程调试

gdb

file ../linux-3.18.6/vmlinux

target remote:1234

设置断点

b sys_execve

b do_execve

b do_execve_common

b exec_binprm

b search_binary_handler

b load_elf_binary

b start_thread

分析:

通过查看源码可以看出执行exec命令是通过调用execlp函数实现的，属于库函数exec*都是execve的封装例程。

装载和启动一个可执行程序依次调用以下函数：

sys_execve() -> do_execve() -> do_execve_common() -> exec_binprm() -> search_binary_handler() -> load_elf_binary() -> start_thread()

总结:当linux内核或程序（例如shell）用fork函数创建子进程后，子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时，该进程执行的程序完全替换为新程序，而新程序则从其main函数开始执行。因为调用exec并不创建新进程，所以前后的进程ID并未改变。exec只是用一个全新的程序替换了当前进程的正文、数据、堆和栈段。

PS:程序编译链接过程

预处理：（.c -> .cpp）

gcc -E -o hello.cpp hello.c -m32

编译：(.cpp -> .s 汇编)

gcc -x cpp-output -S -o hello.s hello.cpp -m32

编译：(.s -> .o 二进制目标代码)

gcc -x assembler -c hello.s -o hello.o -m32

链接：（.o -> a.out）共享库

gcc -o hello hello.o -m32

静态编译：

gcc -o hello.static hello.o -m32 -static

c语言main函数格式：

int main(int argc, char *argv[])

int main(int argc, char *argv[], char *envp[])

库函数exec*都是execve的封装例程

execve函数格式：

int execve(const char * filename,char * const argv[ ],char * const envp[ ])

sys_execve -> do_execve -> do_execve_common -> exec_binprm

说是exec系统调用，实际上在Linux中，并不存在一个exec()的函数形式，exec指的是一组函数，一共有6个，分别是：

int execl(const char *path, const char *arg, ...);

int execv(const char *path, char *const argv[]);

int execle(const char *path, const char *arg, ..., char * const envp[]);

int execve(const char *path, char *const argv[], char *const envp[]);

int execlp(const char *file, const char *arg, ...);

int execvp(const char *file, char *const argv[]);

其中只有execve是真正意义上的系统调用，其它都是在此基础上经过包装的库函数。

区别一：前4个取路径名作为参数，后2个取文件名作为参数；

区别二：参数表的传递（l表示list，v表示vector）；

区别三：向新程序传递环境表。

动态链接：

装载时动态链接

gcc -shared shlibexample.c -o libshlibexample.so -m32

运行时动态链接

gcc -shared dllibexample.c -o libdllibexample.so -m32

主调程序

gcc main.c -o main -L /path/to/your/dir-l shlibexample -ldl -m32

第七周 可执行程序的卸载

第七周可执行程序的卸载