linux第五章笔记

第五章　系统调用

一、与内核通信

1.系统调用:用户空间进程和硬件设备之间添加了一个中间层.该层主要作用有三个：

为用户空间提供了一种硬件的抽象接口
系统调用保证了系统的稳定和安全
每个进程都运行在虚拟系统中，而在用户空间和系统的其余部分提供这样一层公共接口

二、API、POSIX和C库

1. API可以在各种不同的操作系统实现，给应用程序提供完全相同的接口，而它们本身在这些系统上的实现却可能迥异。

2.在Unix世界中，最流行的应用编程接口是基于POSIX标准的。

3. C库包括：

标准C库函数
系统调用接口

4. 程序员就只需要和API打交道，系统调用无关紧要。而内核只需要和系统调用打交道，只负责提供功能。

5. “提供机制而不是策略”——Unix的系统调用抽象出了用于完成某种确定的目的的函数，内核不用关心函数的使用方法。

6. 调用printf()函数时，应用程序、C库和内核之间的关系如下图：

三、系统调用

1. 系统调用（在linux中常称作syscall），通常通过C库中定义的函数调用来进行。返回值是long型变量，如果出错，C库会将错误代码写入errno全局变量。

2. 系统调用再出现错误的时候C库会把错误码写入errno全局变量。通过调用perror()库函数，可以把该变量翻译成用户可以理解的错误字符串。

3. SYSCALL_DEFINE0只是一个宏，它定义一个无参数的系统调用。

4. asmlinkage——这是一个编译指令，通知编译器仅从栈中提取该函数的参数。

所有的系统调用都需要这个限定词
其次函数返回long

5. 系统调用在用户空间和内核空间有不同的返回值类型，在用户空间为int在内核空间为long。

5.3.1　系统调用号

每个系统调用被赋予一个系统调用号，系统调用发生时，内核就是根据传入的系统调用号来知道是哪个系统调用的。

1. 系统调用号一旦分配就不能再有任何变更。

如果一个系统调用被删除，它所占用的系统调用号也不允许被回收利用
Linux有一个“未实现”系统调用sysnisyscall(),它除了返回―ENOSYS外不做任何其他工作，这个错误号就是专门针对无效的系统调用而设的

2. 内核记录了系统调用表中的所有已注册过的系统调用的列表，存储在syscalltable中。在×86-64中，它定义于arch/i386/kernel/syscall_64.c文件中。

5.3.2　系统调用的性能

1. Linux系统执行快的原因：

很短的上下文切换时间
系统调用处理程序和每个系统调用本身也十分简洁

2.设计原则：简洁、高效

四、系统调用处理程序

1. 通知内核的机制是靠软中断实现的：

通过引发一个异常来促使系统切换到内核态去执行异常处理程序，此时的异常处理程序实际上就是系统调用处理程序
它与硬件体系结构紧密相关

5.4.1　指定恰当的系统调用

1. 在x86上，系统调用号是通过eax寄存器传递给内核的。

2. system_call()函数通过将给定的系统调用号与NR_syscall做比较来检查有效性,call *sys_call_table(,%rax,8)：执行相应的系统调用

3. 由于系统调用表中的表项是以64位类型存放的，内核需要将给定的系统调用号乘以4，然后用所得到的结果在该表中查询其位置。

5.4.2　参数传递

　　参数传递最简单的办法是像传递系统调用号一样，把这些参数也放在寄存器里。在X86-32系统上，ebx、ecx、edx、esi、edi按顺序存放前五个参数。需要六个或六个以上参数时应用一个单独的寄存器存放指向所有这些参数在用户空间地址的指针,返回值存放在eax.

五、系统调用的实现

实现一个新的系统调用的步骤：

1. 决定系统调用的用途

明确新系统调用的参数、返回值和错误码，系统调用的接口力求简洁
很多系统调用提供了标志参数以确保向前兼容。标志并不是用来让单个系统调用具有多个不同的行别行为，为了即使增加新的功能和选项，也不破坏向后兼容或不需要增加新的系统调用
确保系统调用的可移植性和健壮性

2. 参数验证

参数合法有效并正确：不应让内核访问无权访问的资源
最重要的检查：用户提供的指针是否有效。内核必须保证指针：
- 指向的内存区域属于用户空间；

- 指向的内存区在进程的地址空间里；

- 指向的内存区在内存的访问权限范围中。

· 两个方法检查在两空间之间数据的来回拷贝：
- copy_to_user()：向用户空间写入数据
- copy_from_user()：从用户空间读取数据
- 针对是否有合法权限的检查
  - capable()：是否有权对指定的资源进行操作
  - 返回0：无权操作

3. 系统调用上下文

内核在执行系统调用的时候处于进程上下文
current指针指向当前任务，即引发系统调用的那个进程
在进程上下文中，内核可以休眠并且可以被抢占
当系统调用返回的时候，控制权仍在system_call()中，它最终会负责切换到用户空间，并让用户进程继续执行下去

4. 绑定系统调用

首先在系统调用表的最后加入一个表项
对于所支持的各种体系结构，系统调用号都必须定义于<asm/unistd.h>中（系统调用号是专属于体系结构ABI（应用程序二进制接口）的部分）
系统调用必须被编译进内核映象（不能被编译成模块）。比如sys.c，它包含了各种各样的系统调用

5. 从用户空间访问系统调用

_syscalln()：Linux提供的一组宏，用于直接对系统调用进行访问。会设置好寄存器并调用陷入指令。
n的范围：0~6，代表传递给系统调用的参数个数。
对每个宏来说，都有2+2*n个参数。
- 第一个参数：对应系统调用返回值类型
- 第二个参数：系统调用的名称
- 按系统调用参数顺序排列的每个参数的类型和名称

六、系统调用上下文

为什么不通过系统调用的方式实现？

建立一个新的系统调用的好处：

系统调用创建容易且使用方便
Linux系统调用的高性能显而易见

问题:

你需要―个系统调用号，而这需要一个内核在处于开发版本的时候由官方分配给你
系统调用被加入稳定内核后就被固化了，它的接口不允许做改动
需要将系统调用分别注册到每个需要支持的体系结构中去
在脚本中不容易调用系统调用，也不能从文件系统直接访问系统调用
由于你需要系统调用号，因此在主内核树之外是很难维护和使用系统调用的

替代方法:

实现一个设备节点，并对此实现read（）和write（）。使用特定的信息进行检索。

像信号量这样的某些接口，可以用文件描述符来表示,因此也就可以按上述方式对其进行操作
把增加的信息作为一个文件放在sysfs的合适位置

总结

系统调用到底是什么？

系统调用是操作系统为用户态进程与硬件设备进行交互提供的一组接口，让应用程序受限的访问硬件设备，提供了新进程与已有进程进行通信的机制，也提供了申请操作系统其他资源的能力。可以保证系统稳定可靠。