linux 之进程基础 (三)、进程API之创建进程 fork、vfork函数

3. 进程API之创建进程 fork、vfork函数

3.1 fork函数

3.1.1 fork 函数原型

Fork 的英文意思是叉子，意思是从一个进程分出多个进程 (两个执行流)。

#include <sys/types.h>
#include <unistd.h>
pid_t fork(void);

返回值：

返回0 ：子进程的执行流
返回>0：父进程的执行流
返回-1：创建失败

功能：

创建一个进程。

fork函数的特点：

fork被调用一次，但返回两次。唯一的区别是在子进程里返回值是0，而在父进程里其返回值是子进程的进程ID。

3.1.2 fork 创建进程的系统中的体现

内核为子进程创建了一个新的task_struct结构。
子进程几乎是父进程的克隆体，它将获得父进程数据空间、堆、栈等资源的副本。
但是task_struct结构有部分内容不一样。比如process id 等。
父进程和子进程共享物理内容中同一个代码段。
复制时复制了父进程的堆栈段，pc指针(正要执行的程序)，所以两个进程都停留在fork函数中，等待返回。因此fork函数会返回两次，一次是在父进程中返回，另一次是在子进程中返回，这两次的返回值是不一样的。(fork的返回的存储是内核帮我们实现的)。函数返回时pid所在栈段被复制并填写了不同的返回值。

3.1.3 fork出来的进程与父进程的关系

图片来自于网络

3.2 fork 函数的实现

3.2.1 fork 函数的经典实现

在这里插入图片描述
从示意图可以看出：

子进程p2 的代码段由p1 复制而来，但是两个进程的代码段映射到了同一片物理内存空间中。即，父进程与子进程共享同一代码段。
子进程p2 的堆、栈、数据段由p1 复制而来，并且映射的物理内存也是不同片的物理内存。即，父进程与子进程的堆、栈、数据段空间各自独立。

上述就是fork() 函数的经典实现。

3.2.2 fork 函数的优化实现

3.2.2.1 copy on write 技术

目前的linux操作系统的实现中支持写时复制技术(copy on write,COW),fork函数的实现就运用了写时复制技术。这在一定程度上改进了fork函数的效率。

传统的fork直接把所有资源复制给新建的子进程，这种实现过于简单并且效率低下，因为它拷贝的数据也许并不共享，更糟的情况是，如果新进程打算立即执行一个新的程序(exec)，那么所有的拷贝工作都将前功尽弃。

运用写时拷贝技术（copy-on-write）,内核只为新生成的子进程创建虚拟空间结构，它们来复制于父进程的虚拟空间结构。但是系统并不为这些段分配物理内存，它们和父进程共享物理内存。即，父子进程的虚拟地址空间是独立的，但是虚拟地址空间映射到同一片物理内存上。

当父子进程中有更改相应段的行为发生时，再为子进程相应的段分配物理空间。也就是说，资源的复制只有在需要写入的时候才进行，在此之前，只是以只读方式共享。这种技术使地址空间上的页的拷贝被推迟到实际发生写入的时候。

这种fork函数的实现不仅节约了物理内存，并且提高了程序的效率。(因为暂时不需要拷贝动作了。)

3.2.2.2 采用copy on write技术的fork函数的实现

在这里插入图片描述

3.２几个特殊的进程

3.2.1获取进程ID、父ID函数

pid_t getpid(void); //返回调用进程的ID号
pid_t getppid(void);//返回调用进程的父ID号

3.1.2 系统中几个特殊的进程

Init 进程是用户空间运行的第一个进程进程id为1
0 号进程是操作系统跑起来运行的第一个进程 1号进程和2号进程都非常重要。许多用户空间进程都是1号进程的子进程。
2号进程负责内核空间。 1号进程是所有用户进程的祖先。

注意:用户空间在运行之前，内核（空间）已经在运行。系统关闭1号进程才结束。

3.1.3 孤儿进程

父进程创建子进程后，谁先结束谁后结束是不一定的。由调度算法决定。

如果父进程，在子进程结束之前先结束。那么子进程就会变成孤儿进程，随后init 来接管他，成为他的父进程。
如果子进程，在父进程结束前先结束，且父进程一直不退出。那么子进程就会变成僵尸进程。

3.1.4 几个疑问

(1)一般编程时，需要父进程后退出。为什么父进程要求父进程后退出？

因为父亲死了，init进程就会称为子进程的父亲。为了避免init被塞进太多的进程，则需要父进程不退出。

(2)为什么需要僵尸状态？

因为子进程的退出状态很重要，它可以返回子进程的死亡状态。因为，只有回收了子进程的退出状态，才能清理僵尸状态进程的资源(代表进程的struct 结构)。

3.3 vfork 函数

3.3.1 vfork函数的原理

在这里插入图片描述从示意图可以看到，vfork()这个做法更加火爆，内核连子进程的虚拟地址空间结构也不创建了，直接共享了父进程的虚拟空间，当然了，这种做法就顺水推舟的共享了父进程的物理空间。即，父子进程既共享虚拟地址空间，又共享物理内存空间。

3.3.2 vfork 函数的使用方法

(1)函数原型

#include <sys/types.h>
#include <unistd.h>
pid_t vfork(void);

(2)函数返回值

成功：子进程中返回 0，父进程中返回子进程 ID。pid_t，为无符号整型。
失败：返回 -1。

(3)函数功能

vfork() 函数和 fork() 函数。一样都是在已有的进程中创建一个新的进程，但它们创建的子进程是有区别的。

3.４vfork 函数的创建的进程与fork函数创建进程的区别

(1)运行顺序不一样

fork()：父子进程的执行次序不确定。
vfork()：保证子进程先运行,在它调用 exec（进程替换）或 exit（退出进程）之后父进程才可能被调度运行。（不可中断睡眠状态）

(2)地址空间的共享不一样

fork函数：子进程拷贝父进程的地址空间，子进程是父进程的一个复制品。
vfork函数：子进程共享父进程的地址空间

注意：准确来说，在调用 exec（进程替换）或 exit（退出进程）之前与父进程数据是共享的。