20169212《Linux内核原理与分析》第八周作业

理论

task_struct的结构关系
非常庞大的数据结构，400多行代码。包括对进程链表的管理，控制台，文件系统描述，文件描述符，内存管理描述，信号描述等。
创建一个新进程在内核中的执行过程
fork、vfork和clone三个系统调用都可以创建一个新进程，而且都是通过调用do_fork来实现进程的创建；Linux通过复制父进程来创建一个新进程，那么这就给我们理解这一个过程提供一个想象的框架：
复制一个PCB——task_struct

err = arch_dup_task_struct(tsk, orig);

要给新进程分配一个新的内核堆栈

ti = alloc_thread_info_node(tsk, node);
tsk->stack = ti;
setup_thread_stack(tsk, orig);   //这里只是复制thread_info，而非复制内核堆栈

要修改复制过来的进程数据，比如pid、进程链表等等都要改改吧，见copy_process内部。
从用户态的代码看fork();函数返回了两次，即在父子进程中各返回一次，父进程从系统调用中返回比较容易理解，子进程从系统调用中返回，那它在系统调用处理过程中的哪里开始执行的呢？这就涉及子进程的内核堆栈数据状态和task_struct中thread记录的sp和ip的一致性问题，这是在哪里设定的？copy_thread in copy_process

1 *childregs = *current_pt_regs();   //复制内核堆栈
2 childregs->ax = 0;   //为什么子进程的fork返回0，这里就是原因！
3  
4 p->thread.sp = (unsigned long) childregs;   //调度到子进程时的内核栈顶
5 p->thread.ip = (unsigned long) ret_from_fork;   //调度到子进程时的第一条指令地址

实验(使用gdb跟踪创建新进程)

fork、vfork和clone三个系统调用都可以创建一个新进程，而且都是通过调用do_fork来实现进程的创建，do_fork完成了创建中的大部分工作。

具体分析过程如下：

cd LinuxKernel
ls
cd menu
vi test.c

在这里与上次实验一样，仍然使用不了git clone这样的命令，于是自己进入menu目录下，对立面的test.c进行修改，修改如下：

#include <unistd.h>  //添加头文件到文件中

int Fork(int argc, char *argv[])  //添加一个新的函数Fork()
{
int pid;
/* fork another process */
pid = fork();                                     //fork之后变为两个进程
if (pid<0) 
{ 
/* error occurred */
fprintf(stderr,"Fork Failed!");
exit(-1);
} 
else if (pid==0)                                 //子进程中fork的返回值为0
{
/*	 child process 	*/
printf("This is Child Process!
");
} 
else 
{ 	
/* 	parent process	 */
printf("This is Parent Process!
");            //父进程中fork的返回值为子进程的ID
/* parent will wait for the child to complete*/
wait(NULL);
printf("Child Complete!
");
}
}
通过这个小程序，可以在用户态创建一个子进程。
//main函数中需要加入:
MenuConfig("fork","Fork a new process",Fork);

保存并退出。
在menu目录下make rootfs便可编译，成功启动MenuOS系统，输入help可以看到如图所示的效果

接下来要使用gdb来跟踪调试进程创建过程，所以需要设置断点。

qemu -kernel linux-3.18.6/arch/x86/boot/bzImage initrd rootfs.img -s -S
gdb
file linux-3.18.6/vmlinux   //加载内核
target remote:1234          //链接到menu os里

分别在sys_clone,do_fork,dup_task_struct,copy_process,copy_thread,ret_from_fork这几处设置断点，如图

当按c继续执行之后，后面的断点依次如图所示

图4中出现了 copy_process

再继续跟踪可以看到如下

问题：

新进程从哪里开始执行？
回答：ret_from_fork决定了新进程的第一条指令地址：

p->thread.ip = (unsigned long) ret_from_fork; //调度到子进程时的第一条指令地址

总结：

Linux通过复制父进程来创建一个子进程,通过调用fork来实现；
Linux会为每个子进程动态的分配一个task_struct结构；
Linux用双向循环链表的方式来组织系统中的所有进程（包括内核线程）
fork()函数被调用一次，但返回两次

书上内容

时钟中断的工作：跟新系统运行时间；跟新实际时间；在SMP系统中均衡调度各处理器的运行列队；检查当前进程是否耗尽时间片，若耗尽则进行重新调度；运行超时的动态定时器；更新资源消耗和处理器时间的统计值。提高HZ的优点：更高时钟中断解析度；提高时间驱动事件的准确性（平均误差5ms->0.5ms）；内核定时器能够以更高的频度和更高准确度执行；依赖定时器的系统调用（如poll和select）能以更高精度运行；对资源消耗和系统运行时间的测量更准确；提供进程抢占的准确度。
定时器是管理内核流逝的时间的基础。使用很简单，执行一些初始化的工作，设置一个超时时间，指定超时发生后执行的函数，然后激活定时器就可以了。定时器与当前执行代码是异步的，因此就有可能存在潜在的竞争条件。
内核把物理页作为内存管理的基本单位；区：ZONE_DMA：包含的页用来执行DMA操作；ZONE_NORMAL：正常映射的页；ZONE_HIGHMEM：“高端内存”（并不能永久映射到内核地址空间）；释放页：void __free_pages(struct page *page, unsigned int order); void free_pages(unsigned long addr, unsigned int order); void free_page(unsigned long addr)。gfp_mask该标志可以分为三类：（1）行为修饰符：描述内核如何分配所需内存。（2）区修饰符：从哪个区分配内存。（3）类型：组合了行为和区修饰符，提供了常用的标志。
使用每个cpu数据具有不少好处。首先是减少了数据锁定，第二是使用每个cpu数据可以大大减少缓存失效。目前并不要求必须使用每个cpu的新接口，新接口并不向后兼容之前的内核。