【进程/作业】篇章一:Linux进程及其管理(进程的管理基础)

概述:监控系统各方面的性能,保障各类服务的有序运行,是运维工作的重要组成部分,本篇就介绍一次常用的系统监控命令和相关的参数说明

具体包含以下几部分:

  1、进程的管理基础 ,主要是讲一下概念性的东西

  2、进程管理类工具【pstree、ps、top、htop、kill、(killall、pkill、pgrep、pidof)】

  3、内存监控类工具【vmstat、pmap】

  4、系统监控类工具【glances、dstat】

本篇文章主要讲解进程的管理基础,主要是以下概念性的东西。



1、进程是什么?

  运行中的程序的一个副本,因为程序可能会同时被运行多次,故可理解为一个副本,每个进程都有生命周期  

linux内核存储进程信息的固定格式,被称为task struct(任务结构体)

多个任务的task struct组成的链表,被称为task list(任务列表)



2、CPU和内存的工作模式总结。

   cpu是分时的:一个进程可占用多少cpu时长,一个cpu在同一时刻只能执行一个任务,CPU自身的寄存器中,存放着正在运行的进程的状态信息,当该进程分配的时间片到了时候,即使该进程没有执行完成,也会被调度出去,让下一个进程放到CPU上去运行,但是对于之前没有执行完成的进程,如果没有一种机制保存下来进程执行到哪里的等等的一些相关信息,那么当下一次轮到该进程执行时,又要重新开始执行,这样是不合理的。为了解决这种问题,就有了保存现场恢复现场的概念

  保存现场:是当正在运行的进程,CPU运行时间到达之后,将进程运行的状态等信息,由内核调度存储到内存中。

  恢复现场:之前保存过的进程的运行状态的信息,当该进程又获得CPU运行时间时,将保存的状态信息调度到CPU上,这样CPU就能根据保存的状态继续运行进程,而不是从头开始运行进程

  内存和磁盘结构差不多,里面也是分空间的,当进程需要用到内存数据的时候,怎么去找内存中不连续的数据呢?

    内存是分空间的:一个进程可占用多少内存空间,内存分配方式有点类似磁盘,分成很多块,但内存不叫块,而是叫页框(page frame)用于存储页面数据,一般一个page的大小为4K。分配的页框可以有多个,且可以不连续。

    因为数据在实际内存中可以不连续,也就是离散的,故一般情况下,内核会虚拟一个内存空间面向进程,进程不需要直接与实际的物理存储的内存打交道,只需与内核虚拟出来的内存打交道(内核虚拟出来的内存的大小,与计算机平台的位数有关系,一般32位系统上,单个进程虚拟出来的内存大小为4G,1G给内核使用,3G给该进程使用;64位系统上,单个进程虚拟出来的内存大小为4G个4G),内核虚拟出来的内存空间叫做线性地址空间,内核虚拟出来的内存对进程而言是连续,且独占的。这样,进程读写内存数据时就认为自己读取的是一个连续的地址空间,且是独占的,这段虚拟出来的空间中,只有真正被使用的部分,内核才会在物理内存上分配空间进行存储

  swap分区:为了防止过多的进程将实际物理内存占满导致程序无法运行,从而有了swap交换分区的概念,swap分区实际是用来临时存放内存中暂时用不到的页面数据。置换时,通常采用LRU算法(很少使用)将最近最少用到的数据暂存在交换分区中

  【如:一次磁盘IO分为两段进行,第一段是将数据从磁盘拿到内存中内核空间,第二段时将内核空间的数据复制一份放到用户空间】



3、线程相关概念 

  线程:是一个进程内部的多个执行流,一个执行流就叫一个线程【注意线程和进程之间的关系】

          一个进程只有一个执行流,也可以有线程,这种模式就叫单进程单线程模型

          一个进程有多个执行流,就叫单进程多线程模型

        如果一个进程有多个执行流,也就是有多个线程,但是如果只有1个CPU,那么也多线程也没有任何意义,因为一个cpu在同一时刻只能同时执行一个任务

        同一个进程内部的多个线程,可以共享内存空间。比如web服务,如果是单进程模型,一个进程相应一个用户请求,如果100个用户请求的都是index.html页面,那么在内存上就需要为每个进程存放都存放一个index.html的数据,这样就造成了内存浪费,但是如果是采用单进程多线程模式,这样利用一个线程相应一个用户请求,这样就只需要为这个进程在内存上存储一份index.html的数据,然后多个线程共享这段数据,这样就大大节约了内存的空间

  什么是常住内存集和虚拟内存集?

    一个进程的数据部分分为指令和数据,程序在执行时,内存中的数据也分指令数据和实际的数据,其中指令数据和部分的实际数据,是不能被交换到交换分区上的,称之为常驻内存集,而有些数据是可以被交换到交换分区上的,称之为虚拟内存集。



4、进程的创建模型

  进程创建:

    init进程:初始化进程,后续的所有用户空间进程管理者(所有进程的父进程)

    其他进程:除了init进程之外,所有进程都由父进程创建,父进程利用fork()系统调用生成,每个进程都是由父进程fork()自身而来,会clone()自身的数据给子进程

              在子进程刚被创建时,子进程和父进程使用的是同一段内存空间;一旦子进程需要对该段内存空间的数据进行修改时,就会复制该段内存空间的数据到另外一段内存空间,子进程就指向了新的内存空间。(这种机制叫CoW(写时复制),如果子进程不对数据进程修改,跟父进程使用的内存空间都是同一个,但是一旦子进程要修改数据,就复制一份数据到另一块内存供子进程单独使用,而从此之后,子进程就一直使用新的内存空间了)

        进程的终止:

    子进程完成一定的任务之后,释放掉自己占用的资源,然后父进程对子进程进行回收



5、进程的优先级

  0-139:

    1-99:实时优先级 【一般是由系统自己判断,我们不回去手动操作】

    100-139:用户可调度的优先级(数字越小,优先级越高) 【用户可以修改的】

  nice值:-20到19分别对应100-139,进程初始时nice默认都为0,普通用户只能调低自己的优先级,也就是加大自己的nice值,而管理员用户可以任意指定

  修改进程的优先级:nice、renice命令 ,怎么调整见篇章三

    可调整的区间为100-139

          通过调整nice值可以调整进程的优先级:

          nice值的范围为-20到19,分别对应进程优先级的100-139

          进程启动时的默认nice值都为0,故其默认优先级为120

          普通用户:只能调大nice值,也就是降低优先级,不能低于0

          管理员:可以任意调整nice值-20到19



6、进程队列【要知道什么是运行队列?什么是过期队列?为什么是140?】 

  Linux内核为了能够快速的实现这些优先级不同的进程的调度,将待运行的进程按照对应的优先级分成了140个运行队列,每个优先级相同的进程为同一个队列,这样,内核进行调度时,不需要遍历整个队列,而是按照优先级从高到低,取队列的第一个进程进行调度

        同时也有140个过期队列,就是将上面运行队列中,调度过的进程,在为其分配的CPU时间片的时间内尚未运行完成,就放到了过期队列,当同优先级的运行队列中的进程都被调度完成后,就会重新调度过期队列,此时过期队列就变成了运行队列



7、进程类型

  守护进程(daemon):跟终端无关,由内核在系统引导过程中启动的进程

  用户前台进程:用户通过终端启动的进程,跟终端相关

  【注意:也可以把前台启动的进程转到后台,以守护进程运行



8、进程的状态【理解5中状态】

  运行状态:running,进程正在运行中

  就绪状态:ready,可以运行但尚未运行

  睡眠状态:sleeping,

    可中断睡眠:interrupt,调度到CPU上可立即运行起来

    不可中断睡眠:uninterruptible,通常是指I/O阻塞的进程,等待I/O完成之前无法继续运行

  僵死状态:zombie,找不到归属,父进程没有回收该进程,父进程就挂了

  停止状态:stopped,暂停与内存中,处于不可被调度并运行的状态



9、进程间的通信机制(IPC:Inter Process Communication)

  同一主机上:

    信号通信(通过kill命令):signal

    共享内存shm:shared memory

  不同主机上面:

    rpc:remote procedure call (NFS介绍基于这种机制)

    套接字socket:IP和端口号

原文地址:https://www.cnblogs.com/l75790/p/9191732.html