第八节 进程的切换和系统的一般执行过程—— 20135203齐岳

第八节 进程的切换和系统的一般执行过程

By 20135203齐岳

本周的主要内容:

  1. Linux中进程调度的基本概念与相关知识
  2. schedule函数如何实现进程调度
  3. Linux进程的执行过程(一般情况与特殊情况)
  4. 宏观描述Linux系统执行

进程切换的主要代码switch_to

进程的调度时机与进程的切换

不同类型进程的不同调度需求

第一种分类:

  • I/O-bound:频繁进行I/O,并且需要花费很多时间等待I/O完成

  • CPU-bound:计算密集,需要大量的CPU时间进行运算

第二种分类:

  • 批处理进程:不必与用户交互,常在后台进行;不必很快响应(典型的批处理系统:编译程序、科学计算)。

  • 实时进程:有实时需求,不应被低优先级进程阻塞,响应时间短、要稳定(典型的实时进程:视频/音频、机械控制等)。

  • 交互式进程:需要经常与用户交互,因此要花很多时间等待用户输入操作,响应时间要快,平均延迟要低(典型的交互式程序:shell、文本编辑程序、图形应用程序)。

Linux中的进程调度

调度策略:是决定什么时候以怎样的方式选择一个新进程运行的规则。Linux中的调度是多种策略和调度算法的组合。

Linux既支持普通的分是进程。也支持实时进程。Linux的调度基于分时和优先级。

Linux根据进程的优先级进行排队

  • 根据特定的算法计算出进程的优先级,用一个值表示,这个值表示把进程如何适当的分配给CPU。

  • Linux中进程的优先级是动态的,调度程序会根据进程行为的周期性调整进程的优先级。(较长时间未分配到CPU的进程优先级升高,已在CPU上运行了较长时间的进程优先级下降)

内核中的调度算法相关代码使用了类似OOD中的策略模式,这些算法从实现的角度看仅仅是从运行队列中选择一个新进程,选择的过程中运用了不同的策略而已。不需要理解这种策略,对我们对于内核的理解并没有帮助。对于理解操作系统的工作机制,反而是进程的调度时机与进程的切换机制更为关键。

schedule函数

schedule函数:实现调度,在队列中自傲一个进程把CPU分配给它。

调用方法:

  • 直接调用schedule()
  • 松散调用,根据need_resched标记
进程调度的时机
  • 中断处理过程(包括时钟中断、I/O中断、系统调用和异常)中,直接调用schedule(),或者返回用户态时根据need_resched标记调用schedule()。

  • 内核线程可以直接调用schedule()进行进程切换,也可以在中断处理过程中进行调度,也就是说内核线程作为一类的特殊的进程可以主动调度,也可以被动调度(内核线程是只有内核态而没有用户态的特殊进程)。

  • 用户态进程只能被动调度,仅能通过陷入内核态后的某个时机点进行调度,即在中断处理过程中进行调度。

进程上下文切换相关代码分析

进程的切换

进程切换(任务切换、上下文切换):为了控制进程的执行,内核必须有能力挂起正在CPU上执行的进程,并恢复以前挂起的某个进程的执行,

挂起正在CPU上执行的进程,与中断时保存现场是不同的,中断前后是在同一个进程上下文中,只是由用户态转向内核态执行;而进程切换是在不同的进程之间进行调度。

进程上下文包含了进程执行需要的所有信息

  • 用户地址空间:包括程序代码,数据,用户堆栈等

  • 控制信息:进程描述符,内核堆栈等

  • 硬件上下文(注意中断也要保存硬件上下文只是保存的方法不同,中断:保存现场&恢复线程;进程调度:switc_to的机制)

schedule()函数实现方法

schedule()函数选择一个新的进程来运行,并调用context _ switch进行上下文的切换,这个宏调用switch _ to来进行关键上下文切换

  • next = pick _ next _ task(rq, prev);//封装了使用的某种进程调度策略,选择一个进程作为next

  • context_switch(rq, prev, next);//实现进程上下文切换

  • switch_to切换寄存器的状态和堆栈,利用两个参数:prev指向当前进程,next指向被调度的进程

      #define switch_to(prev, next, last)
      do {       
      unsigned long ebx, ecx, edx, esi, edi;          
      
      asm volatile(
           "pushfl
    	"      #保存当前进程的flags 
           "pushl %%ebp
    	"        #当前进程的堆栈基址压栈 
    
      	 //以下这两句实际上是实现了内核堆栈的切换,之后的所有压栈动作都是在next的内核堆栈中实现 
           "movl %%esp,%[prev_sp]
    	"  #把当前的栈底保存到prev_sp 
           "movl %[next_sp],%%esp
    	"  #把下一个进程的栈顶放入esp寄存器当中
    
           "movl $1f,%[prev_ip]
    	"  #保存当前进程的eip,在恢复当前进程的时候从这里恢复
      	 "pushl %[next_ip]
    	"   #把next进程的起点压入栈,next进程的栈顶就是它的起点
      	 //如果是进程切换这里一般是$1f,如果是新创建的子进程这里是ret_from_fork	
    
           __switch_canary   
             
      	//这里使用jmp,因此是通过寄存器传递参数($1f);如果是call的话直接ret
           "jmp __switch_to
    "  #通过寄存器传递参数
           "1:	"  #prev进程的起始点 
           
      	 //恢复prev进程的上下文执行环境        
           "popl %%ebp
    	"     #ebp出栈    
           "popfl
    "            #flags出栈
    
      	/* output parameters */                
           : [prev_sp] "=m" (prev->thread.sp),   #当前进程内核堆栈的栈底  
             [prev_ip] "=m" (prev->thread.ip),   #当前进程的eip    
             "=a" (last),                 
                             
             /* clobbered output registers: */     
             "=b" (ebx), "=c" (ecx), "=d" (edx),      
             "=S" (esi), "=D" (edi)             
    
             __switch_canary_oparam                
                                  
             /* input parameters: */                
           : [next_sp]  "m" (next->thread.sp),       #下一个内核堆栈的栈底
             [next_ip]  "m" (next->thread.ip),       #下一个进程执行的起点
                                 
             //为进程切换做准备  
             [prev]     "a" (prev),              
             [next]     "d" (next)               
                                
             __switch_canary_iparam                
                                  
           : /* reloaded segment registers */           
          "memory");                  
      } while (0)
    

以自己的理解并用图示表示如下:

Linux系统的一般执行过程

一般进程切换的过程

正在运行的用户态进程X切换到运行用户态进程Y的过程:

  1. 正在运行的用户态进程X
  2. 发生中断——save cs:eip/esp/eflags(当前进程CPU的状态压入用户态进程X的内核堆栈) load cs:eipss:esp(加载中断服务例程和内核堆栈)。
  3. 进入中断处理进程,首先SAVE_ALL,保存现场
  4. 中断处理过程中或中断返回前调用了schedule(),其中的switch_to做了关键的进程上下文切换
  5. 标号1之后开始运行用户态进程Y(这里Y曾经通过以上步骤被切换出去过因此可以从标号1继续执行)
  6. restore_all 恢复进程X的执行状态
  7. iret - pop cs:eip/ss:esp/eflags from kernel stack
  8. 继续运行用户态进程Y

几种特殊情况

  • 通过中断处理过程中的调度时机,用户态进程与内核线程之间互相切换和内核线程之间互相切换,与最一般的情况非常类似,只是内核线程运行过程中发生中断没有进程用户态和内核态的转换;

  • 内核线程主动调用schedule(),只有进程上下文的切换,没有发生中断上下文的切换,比 最一般的情况略简略;

  • 创建子进程的系统调用在子进程中的执行起点及返回用户态,如fork;

  • 加载一个新的可执行程序后返回到用户态的情况,如execve;

Linux系统架构和执行过程概览

操作系统的基本概念

任何计算机系统都包含一个基本的程序集合,称为操作系统。

  • 内核(进程管理,进程调度,进程间通讯机制,内存管理,中断异常处理,文件系统, I/O
    系统,网络部分)

  • 其他程序(例如函数库、 shell程序、系统程序等等)

操作系统的目的

  • 与硬件交互,管理所有的硬件资源

  • 为用户程序(应用程序)提供一个良好的执行

从CPU的角度看Linux的系统执行

  1. 从shell中得到一个命令,一个字符串c,c=gets()是一个系统调用,从用户态的堆栈进入内核

  1. CPU等待用户输入命令的过程,会切换到其他的进程执行,涉及到进程调度。

  1. 在键盘上敲击了一个命令,键盘发生I/O中断,调用中断处理程序。此时得到了一个输入的参数,则会唤醒刚才由于等待而进入阻塞状态的进程进入就绪状态。

  1. 中断处理过程会出现进程调度的时机,它可能会把进程X作为next进程来执行,这时进程管理就会切换到进程X。然后gets系统调用就获得了需要从键盘中读取的数据,然后返回到用户态。

  2. 重复这个过程,完成不同的操作指令

从内存的角度看Linux的系统执行

物理内存和虚拟之间的映射关系:

实验——跟踪调试schedule函数

  • 进入虚拟机环境,启动内核,并进入调试状态

  • 在schedule处设置断点,c继续执行。

  • 单步执行直到遇到__schedule函数,进入其中查看

  • 继续执行,发现context_switch函数

  • 设置断点后,进入其内部查看,发现内核切换的重点代码

(具体代码运行过程可与上文对照并结合分析一并查看便于理解。)

参考资料

【原创作品转载请注明出处】

  1. 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000
原文地址:https://www.cnblogs.com/July0207/p/5388943.html