do_fork() 源码剖析

　　分析一下do_fork()的源码的主要步骤

1.首次查找_pidmap位图，为新子进程分配新的pid

2.复制进程描述符，返回的是新的进程描述符的地址（struct task_struct *p）

3.初始化完成量，vfrok主要用excv，父进程的虚拟地址空间对其没有用处，所以实现方式为在子进程退出或者替换后父进程才开始执行

4.如果设置了vfork,则调用wait(父进程)

5.free_pidmap(pid):

6.返回子进程pid。

对于第二步，是do_fork的关键

1.检查flag位的合法性

2.为子进程获取进程描述符

　　开辟内核栈+thread_info 一般大小为8k

　　将current的值赋给子进程

3.检查线程数量，设置一些关键字，保存新的pid

4.用系统调用时cpu寄存器中的值初始化新线程，将exa置为0（fork和clone在子进程的返回值）

5.完成一些字段的设置，将新进程加入到链表，将新进程pid加入到散列表

复制父进程每一个vm_area_struct，也复制它的页表，将私有的可写的页都标记为只读，为写时拷贝做准备。

1.判断是否为创建线程，如果是线程，直接使用mm = oldmm ，表示线程公用虚拟地址空间

2.对于非线程，为其创建虚拟地址空间，创建新的局部描述符加入到tsk地址空间，之后调用dup_mmap;

后续需要解决的问题：

1.current是什么

task_struct 包含了进程所有的信息，current是一个宏，由getCurrent()->task替换，此函数内部是一条汇编指令，在x86体系下通过在内核栈尾部插入thread_info结构，计算偏移量，来查找到当前正在运行的进程描述符。

2.用户态fork()->内核态sys_fork()的过程是什么

普通程序调用fork()-->库函数fork()-->系统调用(fork功能号)-->由功能号在 sys_call_table[]中寻到sys_fork()函数地址-->调用sys_fork()，这就完成拉从用户态到内核态的变化过程。

总结一下：

　　看源码前对fork()只停留在用上，看了之后明白了很多死记硬背的点，也有了自己的理解。主要几个点，fork的返回值，进程和线程的区别，vfork现阶段还暂时没有用过先记住吧，还包括子进程继承父进程的信息，还有写时拷贝的先决条件等。