进程控制（二）

exec函数

一、简介

Linux使用exec函数来执行新的程序，以新的子进程来完全代替原有的进程

1)函数原型

在linux中，并不存在exec()函数，exec指的是一组函数，一共有6个，分别是：

#include <unistd.h>
int execl(const char *pathname,const char *arg,...);
int execlp(const char *filename,const char *arg,...);
int execle(const char *pathname,const char *arg,...,char *const envp[]);
int execv(const char *pathname,char *const argv[]);
int execvp(const char *filename,char *const argv[]);
int execve(const char *pathname,char *const argv[],char *const envp[]);

其中只有execve是真正意义上的系统调用，其它都是在此基础上经过包装的库函数
exec函数族的作用是根据指定的文件名找到可执行文件，并用它来取代调用进程的内容。这里的可执行文件既可以是二进制文件，也可以是任何Linux下可执行的脚本文件。

2)函数解析

函数名与参数的关系：

(1)这6个函数都以exec开头（表示属于exec函数组），前3个函数接着字母l，后3个接着字母v，我的理解是l表示list（列举参数），v表示vector（参数向量表）。

(2)它们的区别在于，execv开头的函数是以"char *argv[]"(vector)形式传递命令行参数，而execl开头的函数采用了罗列(list)的方式，把参数一个一个列出来，然后以一个NULL表示结束。这里的NULL的作用和argv数组里的NULL作用是一样的。

(3)字母p是指在环境变量PATH的目录里去查找要执行的可执行文件。

除 execlp和execvp两个以p结尾的函数，之外的4个函数都要求，它们的第1个参数path必须是一个完整的路径，如"/bin/ls"；
而execlp和execvp 的第1个参数file可以仅仅只是一个文件名，如"ls"，这两个函数可以自动到环境变量PATH指定的目录里去查找。

(4)字母e是指给可执行文件指定环境变量。

在全部6个函数中，只有execle和execve使用了char *envp[]传递环境变量；
其它的4个函数都没有这个参数，这并不意味着它们不传递环境变量，这4个函数将把默认的环境变量不做任何修改地传给被执行的应用程序。而execle和execve用指定的环境变量去替代默认的那些。

返回值：

(1)与一般情况不同，exec函数族的函数执行成功后不会返回。

因为调用进程的实体，包括代码段、数据段和堆栈等都已经被新的内容取代，只有进程ID等一些表面上的信息仍保持原样。

(2)调用失败时，会设置errno并返回-1，然后从原程序的调用点接着往下执行。

(3)与其他系统调用比起来，exec很容易失败，被执行文件的位置，权限等很多因素都能导致调用失败。因此，使用exec函数族时，一定要加错误判断语句。

最常见的错误：

找不到文件或路径，此时errno被设置为ENOENT；
数组argv和envp忘记用NULL结束，此时errno被设置为EFAULT；
没有对要执行文件的运行权限，此时errno被设置为EACCES。

二、应用

(1)如果一个进程想执行另一个程序，它就可以fork或vfork出一个新进程，然后调用任何一个exec函数。

(2)为此，Linux还专门对fork作了优化：

通常fork会将调用进程的所有内容原封不动的拷贝到新产生的子进程中去，这些拷贝的动作很费时间，而如果fork完之后我们马上就调用exec，那这些辛辛苦苦拷贝来的东西就会被立刻抹掉，这看起来非常不划算，于是人们设计了一种"写时复制（copy-on-write）" 技术，使得fork结束后并不立刻复制父进程的内容到子进程，而是到了真正使用时才复制，这样如果下一条语句是exec，它就不会作无用功了。其实"写时复制"还是有复制，进程的mm结构、页表都还是被复制了（"写时复制"也必须由这些信息来支撑。否则内核捕捉到CPU访存异常，怎么区分这是“写时复制”引起的，还是真正的越权访问呢？）。

(3)而vfork就把事情做绝了，所有有关于内存的东西都不复制了，父子进程的内存是完全共享的。但是这样一来又有问题了，虽然用户程序可以设计很多方法来避免父子进程间的访存冲突。但是关键的一点，父子进程共用着栈，这可不由用户程序控制。一个进程进行了关于函数调用或返回的操作，则另一个进程的调用栈（实际上就是同一个栈）也被影响了。这样的程序没法运行下去。所以，vfork有个限制，子进程生成后，父进程在vfork中被内核挂起，直到子进程有了自己的内存空间（exec）或退出(_exit)**。并且，在此之前，子进程不能从调用vfork的函数中返回（同时，不能修改栈上变量、不能继续调用除_exit或exec系列之外的函数，否则父进程的数据可能被改写）。

(4)尽管限制很多，vfork后马上exec效率会比fork高不少。

一个关于exec函数族的应用的例子，exec_example.c所示：

#include <stdlib.h>
#include <unistd.h>
#include <stdio.h>
int main(void)
{
 char *envp[] = {"PATH=/tmp","USER=root","STATUS=testing",NULL};
 char *argv_execv[]={"echo","executed by execv",NULL};
 char *argv_execvp[]={"echo","executed by execvp",NULL};
 char *argv_execve[]={"env",NULL};
 if(fork()==0)
 {
        if(execl("/bin/echo","echo","executed by execl",NULL))
        perror("Err on execl");
 }
 if(fork()==0)
 {
        if(execlp("echo","echo","exected by execlp",NULL))
        perror("Error on execlp");
 }
 if(fork()==0)
 {
        if(execle("/usr/bin/env","env",NULL,envp))
        error("Error on execle");
 }
 if(fork()==0)
 {
        if(execv("/bin/echo",argv_execv))
        perror("Error on execv");
 }
 if(fork()==0)
 {
        if(execvp("echo",argv_execvp))
        perror("Error on execvp");
 }
 if(fork()==0)
 {
        if(execve("/usr/bin/env",argv_execve,envp))
        perror("Error on execve");
 }
 return 0;
}


hyx@hyx-virtual-machine:~/test$ executed by execl
executed by execvp
PATH=/tmp
USER=root
STATUS=testing
executed by execv
PATH=/tmp
USER=root
STATUS=testing
exected by execlp

由于各个子进程执行的顺序无法控制，所以有可能出现一个比较混乱的输出——各子进程打印的结果交杂在一起，而不是严格按照程序中列出的次序。若将程序中fork都改为vfork，则各个exec执行的顺序将按序执行。