【进程/作业】篇章一：Linux进程及其管理（进程的管理基础）

概述：监控系统各方面的性能，保障各类服务的有序运行，是运维工作的重要组成部分，本篇就介绍一次常用的系统监控命令和相关的参数说明

具体包含以下几部分：

　　1、进程的管理基础，主要是讲一下概念性的东西

　　2、进程管理类工具【pstree、ps、top、htop、kill、（killall、pkill、pgrep、pidof）】

　　3、内存监控类工具【vmstat、pmap】

　　4、系统监控类工具【glances、dstat】

本篇文章主要讲解进程的管理基础，主要是以下概念性的东西。

1、进程是什么？

　　运行中的程序的一个副本，因为程序可能会同时被运行多次，故可理解为一个副本，每个进程都有生命周期　　

linux内核存储进程信息的固定格式，被称为task struct(任务结构体)

多个任务的task struct组成的链表，被称为task list(任务列表)

2、CPU和内存的工作模式总结。

　　 cpu是分时的：一个进程可占用多少cpu时长，一个cpu在同一时刻只能执行一个任务，CPU自身的寄存器中，存放着正在运行的进程的状态信息，当该进程分配的时间片到了时候，即使该进程没有执行完成，也会被调度出去，让下一个进程放到CPU上去运行，但是对于之前没有执行完成的进程，如果没有一种机制保存下来进程执行到哪里的等等的一些相关信息，那么当下一次轮到该进程执行时，又要重新开始执行，这样是不合理的。为了解决这种问题，就有了保存现场和恢复现场的概念

　　保存现场：是当正在运行的进程，CPU运行时间到达之后，将进程运行的状态等信息，由内核调度存储到内存中。

　　恢复现场：之前保存过的进程的运行状态的信息，当该进程又获得CPU运行时间时，将保存的状态信息调度到CPU上，这样CPU就能根据保存的状态继续运行进程，而不是从头开始运行进程

　　内存和磁盘结构差不多，里面也是分空间的，当进程需要用到内存数据的时候，怎么去找内存中不连续的数据呢？

　　　　内存是分空间的：一个进程可占用多少内存空间，内存分配方式有点类似磁盘，分成很多块，但内存不叫块，而是叫页框（page frame）用于存储页面数据，一般一个page的大小为4K。分配的页框可以有多个，且可以不连续。

　　　　因为数据在实际内存中可以不连续，也就是离散的，故一般情况下，内核会虚拟一个内存空间面向进程，进程不需要直接与实际的物理存储的内存打交道，只需与内核虚拟出来的内存打交道（内核虚拟出来的内存的大小，与计算机平台的位数有关系，一般32位系统上，单个进程虚拟出来的内存大小为4G，1G给内核使用，3G给该进程使用;64位系统上，单个进程虚拟出来的内存大小为4G个4G），内核虚拟出来的内存空间叫做线性地址空间，内核虚拟出来的内存对进程而言是连续，且独占的。这样，进程读写内存数据时就认为自己读取的是一个连续的地址空间，且是独占的，这段虚拟出来的空间中，只有真正被使用的部分，内核才会在物理内存上分配空间进行存储

　　swap分区：为了防止过多的进程将实际物理内存占满导致程序无法运行，从而有了swap交换分区的概念，swap分区实际是用来临时存放内存中暂时用不到的页面数据。置换时，通常采用LRU算法（很少使用）将最近最少用到的数据暂存在交换分区中

　　【如：一次磁盘IO分为两段进行，第一段是将数据从磁盘拿到内存中内核空间，第二段时将内核空间的数据复制一份放到用户空间】

3、线程相关概念　

　　线程：是一个进程内部的多个执行流，一个执行流就叫一个线程【注意线程和进程之间的关系】

　　一个进程只有一个执行流，也可以有线程，这种模式就叫单进程单线程模型

　　一个进程有多个执行流，就叫单进程多线程模型

如果一个进程有多个执行流，也就是有多个线程，但是如果只有1个CPU，那么也多线程也没有任何意义，因为一个cpu在同一时刻只能同时执行一个任务

同一个进程内部的多个线程，可以共享内存空间。比如web服务，如果是单进程模型，一个进程相应一个用户请求，如果100个用户请求的都是index.html页面，那么在内存上就需要为每个进程存放都存放一个index.html的数据，这样就造成了内存浪费，但是如果是采用单进程多线程模式，这样利用一个线程相应一个用户请求，这样就只需要为这个进程在内存上存储一份index.html的数据，然后多个线程共享这段数据，这样就大大节约了内存的空间

　　什么是常住内存集和虚拟内存集？

　　　　一个进程的数据部分分为指令和数据，程序在执行时，内存中的数据也分指令数据和实际的数据，其中指令数据和部分的实际数据，是不能被交换到交换分区上的，称之为常驻内存集，而有些数据是可以被交换到交换分区上的，称之为虚拟内存集。

4、进程的创建模型

　　进程创建：

　　　　init进程：初始化进程，后续的所有用户空间进程管理者（所有进程的父进程）

　　　　其他进程：除了init进程之外，所有进程都由父进程创建，父进程利用fork()系统调用生成，每个进程都是由父进程fork()自身而来，会clone()自身的数据给子进程

在子进程刚被创建时，子进程和父进程使用的是同一段内存空间；一旦子进程需要对该段内存空间的数据进行修改时，就会复制该段内存空间的数据到另外一段内存空间，子进程就指向了新的内存空间。（这种机制叫CoW（写时复制），如果子进程不对数据进程修改，跟父进程使用的内存空间都是同一个，但是一旦子进程要修改数据，就复制一份数据到另一块内存供子进程单独使用，而从此之后，子进程就一直使用新的内存空间了）

进程的终止：

　　　　子进程完成一定的任务之后，释放掉自己占用的资源，然后父进程对子进程进行回收

5、进程的优先级

　　0-139：

　　　　1-99：实时优先级【一般是由系统自己判断，我们不回去手动操作】

　　　　100-139：用户可调度的优先级（数字越小，优先级越高）【用户可以修改的】

　　nice值：-20到19分别对应100-139，进程初始时nice默认都为0，普通用户只能调低自己的优先级，也就是加大自己的nice值，而管理员用户可以任意指定

　　修改进程的优先级：nice、renice命令 ，怎么调整见篇章三

　　　　可调整的区间为100-139

　　通过调整nice值可以调整进程的优先级：

　　nice值的范围为-20到19，分别对应进程优先级的100-139

　　进程启动时的默认nice值都为0，故其默认优先级为120

　　普通用户：只能调大nice值，也就是降低优先级，不能低于0

　　管理员：可以任意调整nice值-20到19

6、进程队列【要知道什么是运行队列？什么是过期队列？为什么是140？】　

　　Linux内核为了能够快速的实现这些优先级不同的进程的调度，将待运行的进程按照对应的优先级分成了140个运行队列，每个优先级相同的进程为同一个队列，这样，内核进行调度时，不需要遍历整个队列，而是按照优先级从高到低，取队列的第一个进程进行调度

同时也有140个过期队列，就是将上面运行队列中，调度过的进程，在为其分配的CPU时间片的时间内尚未运行完成，就放到了过期队列，当同优先级的运行队列中的进程都被调度完成后，就会重新调度过期队列，此时过期队列就变成了运行队列

7、进程类型

　　守护进程(daemon)：跟终端无关，由内核在系统引导过程中启动的进程

　　用户前台进程：用户通过终端启动的进程，跟终端相关

【注意：也可以把前台启动的进程转到后台，以守护进程运行】

8、进程的状态【理解5中状态】

　　运行状态：running，进程正在运行中

　　就绪状态：ready，可以运行但尚未运行

　　睡眠状态：sleeping，

　　　　可中断睡眠：interrupt，调度到CPU上可立即运行起来

　　　　不可中断睡眠：uninterruptible，通常是指I/O阻塞的进程，等待I/O完成之前无法继续运行

　　僵死状态：zombie，找不到归属，父进程没有回收该进程，父进程就挂了

　　停止状态：stopped，暂停与内存中，处于不可被调度并运行的状态

9、进程间的通信机制（IPC:Inter Process Communication）

　　同一主机上：

　　　　信号通信（通过kill命令）：signal

　　　　共享内存shm：shared memory

　　不同主机上面：

　　　　rpc：remote procedure call （NFS介绍基于这种机制）

　　　　套接字socket：IP和端口号