第八节进程的切换和系统的一般执行过程—— 20135203齐岳

第八节进程的切换和系统的一般执行过程

By 20135203齐岳

本周的主要内容：

Linux中进程调度的基本概念与相关知识
schedule函数如何实现进程调度
Linux进程的执行过程（一般情况与特殊情况）
宏观描述Linux系统执行

进程切换的主要代码switch_to

进程的调度时机与进程的切换

不同类型进程的不同调度需求

第一种分类：

I/O-bound：频繁进行I/O，并且需要花费很多时间等待I/O完成
CPU-bound：计算密集，需要大量的CPU时间进行运算

第二种分类：

批处理进程：不必与用户交互，常在后台进行；不必很快响应（典型的批处理系统：编译程序、科学计算）。
实时进程：有实时需求，不应被低优先级进程阻塞，响应时间短、要稳定（典型的实时进程：视频/音频、机械控制等）。
交互式进程：需要经常与用户交互，因此要花很多时间等待用户输入操作，响应时间要快，平均延迟要低（典型的交互式程序：shell、文本编辑程序、图形应用程序）。

Linux中的进程调度

调度策略：是决定什么时候以怎样的方式选择一个新进程运行的规则。Linux中的调度是多种策略和调度算法的组合。

Linux既支持普通的分是进程。也支持实时进程。Linux的调度基于分时和优先级。

Linux根据进程的优先级进行排队

根据特定的算法计算出进程的优先级，用一个值表示，这个值表示把进程如何适当的分配给CPU。
Linux中进程的优先级是动态的，调度程序会根据进程行为的周期性调整进程的优先级。（较长时间未分配到CPU的进程优先级升高，已在CPU上运行了较长时间的进程优先级下降）

内核中的调度算法相关代码使用了类似OOD中的策略模式，这些算法从实现的角度看仅仅是从运行队列中选择一个新进程，选择的过程中运用了不同的策略而已。不需要理解这种策略，对我们对于内核的理解并没有帮助。对于理解操作系统的工作机制，反而是进程的调度时机与进程的切换机制更为关键。

schedule函数

schedule函数：实现调度，在队列中自傲一个进程把CPU分配给它。

调用方法：

直接调用schedule()
松散调用，根据need_resched标记

进程调度的时机

中断处理过程（包括时钟中断、I/O中断、系统调用和异常）中，直接调用schedule()，或者返回用户态时根据need_resched标记调用schedule()。
内核线程可以直接调用schedule()进行进程切换，也可以在中断处理过程中进行调度，也就是说内核线程作为一类的特殊的进程可以主动调度，也可以被动调度（内核线程是只有内核态而没有用户态的特殊进程）。
用户态进程只能被动调度，仅能通过陷入内核态后的某个时机点进行调度，即在中断处理过程中进行调度。

进程上下文切换相关代码分析

进程的切换

进程切换（任务切换、上下文切换）：为了控制进程的执行，内核必须有能力挂起正在CPU上执行的进程，并恢复以前挂起的某个进程的执行，

挂起正在CPU上执行的进程，与中断时保存现场是不同的，中断前后是在同一个进程上下文中，只是由用户态转向内核态执行；而进程切换是在不同的进程之间进行调度。

进程上下文包含了进程执行需要的所有信息

用户地址空间：包括程序代码，数据，用户堆栈等
控制信息：进程描述符，内核堆栈等
硬件上下文（注意中断也要保存硬件上下文只是保存的方法不同，中断：保存现场&恢复线程；进程调度：switc_to的机制）

schedule()函数实现方法

schedule()函数选择一个新的进程来运行，并调用context _ switch进行上下文的切换，这个宏调用switch _ to来进行关键上下文切换

next = pick _ next _ task(rq, prev);//封装了使用的某种进程调度策略，选择一个进程作为next
context_switch(rq, prev, next);//实现进程上下文切换

switch_to切换寄存器的状态和堆栈，利用两个参数：prev指向当前进程，next指向被调度的进程

  #define switch_to(prev, next, last)
  do {       
  unsigned long ebx, ecx, edx, esi, edi;          
  
  asm volatile(
       "pushfl
	"      #保存当前进程的flags 
       "pushl %%ebp
	"        #当前进程的堆栈基址压栈 

  	 //以下这两句实际上是实现了内核堆栈的切换，之后的所有压栈动作都是在next的内核堆栈中实现 
       "movl %%esp,%[prev_sp]
	"  #把当前的栈底保存到prev_sp 
       "movl %[next_sp],%%esp
	"  #把下一个进程的栈顶放入esp寄存器当中

       "movl $1f,%[prev_ip]
	"  #保存当前进程的eip，在恢复当前进程的时候从这里恢复
  	 "pushl %[next_ip]
	"   #把next进程的起点压入栈，next进程的栈顶就是它的起点
  	 //如果是进程切换这里一般是$1f,如果是新创建的子进程这里是ret_from_fork	

       __switch_canary   
         
  	//这里使用jmp，因此是通过寄存器传递参数（$1f）；如果是call的话直接ret
       "jmp __switch_to
"  #通过寄存器传递参数
       "1:	"  #prev进程的起始点 
       
  	 //恢复prev进程的上下文执行环境        
       "popl %%ebp
	"     #ebp出栈    
       "popfl
"            #flags出栈

  	/* output parameters */                
       : [prev_sp] "=m" (prev->thread.sp),   #当前进程内核堆栈的栈底  
         [prev_ip] "=m" (prev->thread.ip),   #当前进程的eip    
         "=a" (last),                 
                         
         /* clobbered output registers: */     
         "=b" (ebx), "=c" (ecx), "=d" (edx),      
         "=S" (esi), "=D" (edi)             

         __switch_canary_oparam                
                              
         /* input parameters: */                
       : [next_sp]  "m" (next->thread.sp),       #下一个内核堆栈的栈底
         [next_ip]  "m" (next->thread.ip),       #下一个进程执行的起点
                             
         //为进程切换做准备  
         [prev]     "a" (prev),              
         [next]     "d" (next)               
                            
         __switch_canary_iparam                
                              
       : /* reloaded segment registers */           
      "memory");                  
  } while (0)

以自己的理解并用图示表示如下：

Linux系统的一般执行过程

一般进程切换的过程

正在运行的用户态进程X切换到运行用户态进程Y的过程：

正在运行的用户态进程X
发生中断——save cs:eip/esp/eflags(当前进程CPU的状态压入用户态进程X的内核堆栈) load cs:eipss:esp(加载中断服务例程和内核堆栈)。
进入中断处理进程，首先SAVE_ALL，保存现场
中断处理过程中或中断返回前调用了schedule()，其中的switch_to做了关键的进程上下文切换
标号1之后开始运行用户态进程Y(这里Y曾经通过以上步骤被切换出去过因此可以从标号1继续执行)
restore_all 恢复进程X的执行状态
iret - pop cs:eip/ss:esp/eflags from kernel stack
继续运行用户态进程Y

几种特殊情况

通过中断处理过程中的调度时机，用户态进程与内核线程之间互相切换和内核线程之间互相切换，与最一般的情况非常类似，只是内核线程运行过程中发生中断没有进程用户态和内核态的转换；
内核线程主动调用schedule()，只有进程上下文的切换，没有发生中断上下文的切换，比最一般的情况略简略；
创建子进程的系统调用在子进程中的执行起点及返回用户态，如fork；
加载一个新的可执行程序后返回到用户态的情况，如execve；