linux 之进程基础 (三)、进程API之创建进程 fork、vfork函数

3. 进程API之创建进程 fork、vfork函数

3.1 fork函数

3.1.1 fork 函数原型

Fork 的英文意思是叉子 ,意思是 从一个进程分出多个进程 (两个执行流)。

#include <sys/types.h>
#include <unistd.h>
pid_t fork(void);

返回值:

  • 返回0 : 子进程的执行流
  • 返回>0:父进程的执行流
  • 返回-1: 创建失败

功能

  • 创建一个进程。

fork函数的特点:

  • fork被调用一次,但返回两次。唯一的区别是在子进程里返回值是0,而在父进程里其返回值是子进程的进程ID。

3.1.2 fork 创建进程的系统中的体现

  • 内核为子进程创建了一个新的task_struct结构。
  • 子进程几乎是父进程的克隆体,它将获得父进程数据空间、堆、栈等资源的副本。
  • 但是task_struct结构有部分内容不一样。比如process id 等。
  • 父进程和子进程共享物理内容中同一个代码段。
  • 复制时复制了父进程的堆栈段,pc指针(正要执行的程序),所以两个进程都停留在fork函数中,等待返回。因此fork函数会返回两次,一次是在父进程中返回,另一次是在子进程中返回,这两次的返回值是不一样的。(fork的返回的存储是内核帮我们实现的)。函数返回时pid所在栈段被复制并填写了不同的返回值。

3.1.3 fork出来的进程与父进程的关系

图片来自于网络

3.2 fork 函数 的实现

3.2.1 fork 函数的经典实现

在这里插入图片描述
从示意图可以看出:

  • 子进程p2 的代码段由p1 复制而来,但是两个进程的代码段映射到了同一片物理内存空间中。即,父进程与子进程共享同一代码段。
  • 子进程p2 的堆、栈、数据段由p1 复制而来,并且映射的物理内存也是不同片的物理内存。即,父进程与子进程的堆、栈、数据段空间各自独立。

上述就是fork() 函数的经典实现。

3.2.2 fork 函数的优化实现

3.2.2.1 copy on write 技术

目前的linux操作系统的实现中支持写时复制技术(copy on write,COW),fork函数的实现就运用了写时复制技术。这在一定程度上改进了fork函数的效率。

传统的fork直接把所有资源复制给新建的子进程,这种实现过于简单并且效率低下,因为它拷贝的数据也许并不共享,更糟的情况是,如果新进程打算立即执行一个新的程序(exec),那么所有的拷贝工作都将前功尽弃。

运用写时拷贝技术(copy-on-write),内核只为新生成的子进程创建虚拟空间结构,它们来复制于父进程的虚拟空间结构。但是系统并不为这些段分配物理内存,它们和父进程共享物理内存。即,父子进程的虚拟地址空间是独立的,但是虚拟地址空间映射到同一片物理内存上。

当父子进程中有更改相应段的行为发生时,再为子进程相应的段分配物理空间。也就是说,资源的复制只有在需要写入的时候才进行,在此之前,只是以只读方式共享。这种技术使地址空间上的页的拷贝被推迟到实际发生写入的时候。

这种fork函数的实现不仅节约了物理内存,并且提高了程序的效率。(因为暂时不需要拷贝动作了。)

3.2.2.2 采用copy on write技术的fork函数的实现

在这里插入图片描述

3.2几个特殊的进程

3.2.1获取进程ID、父ID函数

pid_t getpid(void); //返回调用进程的ID号
pid_t getppid(void);//返回调用进程的父ID号

3.1.2 系统中几个特殊的进程

  • Init 进程是用户空间运行的第一个进程 进程id为1
  • 0 号进程是操作系统跑起来运行的第一个进程 1号进程 和2号进程都非常重要。许多用户空间进程都是1号进程的子进程。
  • 2号进程负责内核空间。 1号进程是所有用户进程的祖先。

注意:用户空间在运行之前,内核(空间)已经在运行。 系统关闭1号进程才结束。

3.1.3 孤儿进程

父进程创建子进程后,谁先结束谁后结束是不一定的。由调度算法决定。

  • 如果父进程,在子进程结束之前先结束。那么子进程就会变成孤儿进程,随后init 来接管他,成为他的父进程。
  • 如果子进程,在父进程结束前先结束,且父进程一直不退出。那么子进程就会变成僵尸进程。

3.1.4 几个疑问

(1)一般编程时,需要父进程后退出。为什么父进程要求父进程后退出?

因为父亲死了,init进程就会称为子进程的父亲。为了避免init被塞进太多的进程,则需要父进程不退出。

(2)为什么需要僵尸状态?

因为子进程的退出状态很重要,它可以返回子进程的死亡状态。因为,只有回收了子进程的退出状态,才能清理僵尸状态进程的资源(代表进程的struct 结构)。

3.3 vfork 函数

3.3.1 vfork函数的原理

在这里插入图片描述从示意图可以看到,vfork()这个做法更加火爆,内核连子进程的虚拟地址空间结构也不创建了,直接共享了父进程的虚拟空间,当然了,这种做法就顺水推舟的共享了父进程的物理空间。即,父子进程既共享虚拟地址空间,又共享物理内存空间。

3.3.2 vfork 函数的使用方法

(1)函数原型
#include <sys/types.h>
#include <unistd.h>
pid_t vfork(void);
(2)函数返回值
  • 成功:子进程中返回 0,父进程中返回子进程 ID。pid_t,为无符号整型。
  • 失败:返回 -1。
(3)函数功能

vfork() 函数和 fork() 函数。一样都是在已有的进程中创建一个新的进程,但它们创建的子进程是有区别的。

3.4vfork 函数的创建的进程与fork函数创建进程的区别

(1)运行顺序不一样

  • fork(): 父子进程的执行次序不确定。
  • vfork():保证子进程先运行,在它调用 exec(进程替换) 或 exit(退出进程)之后父进程才可能被调度运行。(不可中断睡眠状态)

(2)地址空间的共享不一样

  • fork函数: 子进程拷贝父进程的地址空间,子进程是父进程的一个复制品。
  • vfork函数:子进程共享父进程的地址空间

注意:准确来说,在调用 exec(进程替换) 或 exit(退出进程) 之前与父进程数据是共享的。

原文地址:https://www.cnblogs.com/lasnitch/p/12764131.html