《信息安全系统设计基础》第十三周学习总结

20145224 《信息安全系统设计基础》第十三周学习总结

教材学习内容总结

第十一章网络编程

1.客户端-服务器编程模型

•每个网络应用都是基于客户端-服务器模型的。
•客户端-服务器模型中的基本操作是事务。

2.网络

•对于主机，网络是一种I/O设备，作为数据源和数据接收方。
•物理上而言，网络是一个按照地理远近组成的层次系统。最底层是LAN。
•一个以太网段，包括电缆和集线器；每根电缆都有相同的最大位带宽；集线器不加分辩地将一个端口上收到的每个位复制到其他所有的端口上。因此，每台主机都能看到每个位。
使用电缆和网桥，多个以太网段可以连接成较大的局域网，称为桥接以太网。这些电缆的带宽可以是不同的。
•互联网络通过协议实现跨过不兼容发送数据。
协议具备两种基本能力：命名机制、传送机制。

3.全球IP因特网

•TCP/IP协议（协议族）。
•因特网的客户端和服务器混合使用套接字接口函数和Unix I/O函数进行通信。
•一个IP地址就是一个32位无符号整数。
•IP地址通常以点分十进制表示法来表示。
3.2 因特网域名
•因特网应用程序通过调用gethostbyname函数和gethostbyaddr函数，从DNS数据库中检索任意的主机条目。

gethostbyname函数：返回和域名name相关的主机条目。
gethostbyaddr函数：返回和IP地址相关联的主机条目。

3.3 因特网链接
•套接字是连接的端点。
•每个套接字都有相应的套接字地址，由一个因特网地址和一个16位的整数端口组成的，用“地址：端口”来表示。
•一个连接是由它两端的套接字地址惟一确定的。这对套接字地址叫做套接字对。

4.套接字接口

•套接字接口是一组用来结合unit I/O函数创建网络应用的函数。
4.1套接字地址结构
•从unit内核的角度来看，套接字就是通信的端点；从unix程序的角度来看，套接字就是一个有相应描述符的打开文件。
4.2 函数
•sockte函数
创建一个套接字描述符。
•connect函数
建立和服务器的连接。
•open_clientfd函数
将socket和connect函数包装而成。客户端可以用它来和服务器建立连接。
•bind函数
•listen函数
•accept函数
均被服务器用于和客户端建立连接。
•open_listenfd函数
socket、bind和listen函数结合。用于服务器创建一个监听描述符。

5.Web服务器

5.1Web基础
•客户端和服务器之间一个交互用的是基于文本的应用级协议——HTTP
•Web服务和常规文件检索服务区别
Web内容可以用一个叫做HTML的语言来编写。
5.2Web内容
•以两种不同方式向客户端提供内容
服务静态内容
服务动态内容
5.3HTTP事务
响应
•HTTP请求（方法：GET POST OPTIONS HEAD PUT DELETE TRACE）
•HTTP响应
5.4服务动态内容
•客户端如何将程序参数传递给服务器
•服务器如何将参数传递给子进程
•服务器如何将其他信息传递给子进程
•子进程将它的输出发送到那儿

第十二章并发编程

并发编程

•程序级并发——进程
•函数级并发——线程
•三种基本的构造并发程序的方法：

1、进程：每个逻辑控制流是一个进程，由内核进行调度，进程有独立的虚拟地址空间

2、I/O多路复用：逻辑流被模型化为状态机，所有流共享同一个地址空间

3、线程：运行在单一进程上下文中的逻辑流，由内核进行调度，共享同一个虚拟地址空间

基于进程的并发编程

•构造并发程序最简单的方法——用进程。常用函数如下：fork，exec，waitpid
•构造并发服务器：在父进程中接受客户端连接请求，然后创建一个新的子进程来为每个新客户端提供服务。
•需要注意的事情：

1.父进程需要关闭它的已连接描述符的拷贝（子进程也需要关闭）

2.必须要包括一个SIGCHLD处理程序来回收僵死子进程的资源

3.父子进程之间共享文件表，但是不共享用户地址空间

•独立地址空间的优点是防止虚拟存储器被错误覆盖，缺点是开销高，共享状态信息才需要IPC机制

基于I/O多路复用的并发编程

•I/O多路复用技术使用select函数要求内核挂起进程，只有在一个或多个I/O事件发生后，才将控制返回给应用程序。
•select函数处理类型为fd_set的集合，即描述符集合，并在逻辑上描述为一个大小为n的位向量，每一位b[k]对应描述符k，但当且仅当b[k]=1，描述符k才表明是描述符集合的一个元素。
•描述符能做的三件事：

1、分配他们
2、将一个此种类型的变量赋值给另一个变量
3、用FD_ZERO、FD_SET、FD_CLR和FD_ISSET宏指令来修改和检查它们

•当且仅当一个从该描述符读取一个字节的请求不会阻塞时，描述符k表示准备好可以读了
•我们必须在每次调用select时都更新读集合
•事件驱动程序：将逻辑流模型化为状态机。
•一个状态机就是一组状态、输入事件和转移，其中转移就是将状态和输入事件映射到状态。
•基于I/O多路复用的并发事件驱动服务器的流程如下：
•select函数检测到输入事件
•add_client函数创建新状态机
•check_clients函数执行状态转移（在课本的例题中是回送输入行），并且完成时删除该状态机。

基于线程的并发编程

•线程：就是运行在进程上下文中的逻辑流。
•线程由内核自动调度。每个线程都有它自己的线程上下文：

一个唯一的整数线程ID——TID
栈
栈指针
程序计数器
通用目的寄存器
条件码

线程执行模型

•在每个进程开始生命周期时都是单一线程——主线程，与其他进程的区别仅有：它总是进程中第一个运行的线程。
•对等线程是某时刻主线程创建，之后两个线程并发运行每个对等线程都能读写相同的共享数据。
•主线程切换到对等线程的方式是上下文切换，对等线程执行一段时间后会控制传递回主线程，以此类推，切换的原因是：
•主线程执行一个慢速系统调用，如read或sleep
•被系统的间隔计时器中断
•线程和进程的区别:

线程的上下文切换比进程快得多
组织形式：  •进程：严格的父子层次
            •线程：一个进程相关线程组成对等（线程）池，和其他进程的线程独立开来。一个线程可以杀死它的任意对等线程，或者等待他的任意对等线程终止。

Posix线程

•Posix线程是C程序中处理线程的一个标准接口。
•线程的代码和本地数据被封装在一个线程例程中
•每个线程例程都以一个通用指针为输入，并返回一个通用指针。

创建线程

•创建线程：pthread_create函数，返回时参数tid包含新创建线程的ID
•查看线程ID：pthread_self函数，返回调用者的线程ID（TID）

终止线程

•终止线程的几个方式：

隐式终止：顶层的线程例程返回
显示终止：调用pthread_exit函数
        *如果主线程调用，会先等待所有其他对等线程终止，再终止主线程和整个进程，返回值为pthread_return

•某个对等线程调用Unix的exit函数，会终止进程与其相关线程
•另一个对等线程通过以当前线程ID作为参数调用pthread_cancle来终止当前线程

回收已终止线程的资源

•pthread_join函数等待其他线程终止
•这个函数会阻塞，知道线程tid终止，将线程例程返回的(void*)指针赋值为thread_return指向的位置，然后回收已终止线程占用的所有存储器资源

分离线程

•在任何一个时间点上，线程是可结合的，或是分离的。
•可结合的线程
•能够被其他线程收回其资源和杀死
•被收回钱，它的存储器资源没有被释放
•每个可结合线程要么被其他线程显式的收回，要么通过调用pthread_detach函数被分离
•分离的线程
•不能被其他线程回收或杀死
•存储器资源在它终止时由系统自动释放
•pthread_detach函数可以分离可结合线程tid。
•线程能够通过以pthread_self()为参数的pthread_detach调用来分离他们自己。
•每个对等线程都应该在他开始处理请求之前分离他自身，以使得系统能在它终止后回收它的存储器资源。

初始化线程

•pthread_once函数允许你初始化与线程例程相关的状态，总是返回0.
•调用pthread_create时，用传递指针的方法将已连接描述符传递给对等进程
•避免存储器泄露，必须分离每个线程，使它终止时它的存储器资源能被收回。

多线程程序中的共享变量

•一个变量是共享的，当且仅当多个线程引用这个变量的某个实例
•寄存器从不共享，虚拟存储器总是共享的

共享变量

•变量v是共享的——当且仅当它的一个实例被一个以上的线程引用
•一般而言，没有办法预测操作系统是否将为你的线程选择一个正确的顺序。

进度图

•进度图是将n个并发线程的执行模型化为一条n维笛卡尔空间中的轨迹线，原点对应于没有任何线程完成一条指令的初始状态。
•当n=2时，状态比较简单，是比较熟悉的二维坐标图，横纵坐标各代表一个线程，而转换被表示为有向边
•转换规则：

合法的转换是向右或者向上，即某一个线程中的一条指令完成

两条指令不能在同一时刻完成，即不允许出现对角线

程序不能反向运行，即不能出现向下或向左

而一个程序的执行历史被模型化为状态空间中的一条轨迹线。

•线程循环代码的分解：

H：在循环头部的指令块
L：加载共享变量cnt到线程i中寄存器%eax的指令。
U：更新（增加）%eax的指令
S：将%eax的更新值存回到共享变量cnt的指令
T：循环尾部的指令块

•几个概念：

临界区：对于线程i，操作共享变量cnt内容的指令L,U,S构成了一个关于共享变量cnt的临界区。

不安全区：两个临界区的交集形成的状态

安全轨迹线：绕开不安全区的轨迹线

信号量

•信号量实现互斥的基本原理
•两个或多个进程通过传递信号进行合作，可以迫使进程在某个位置暂时停止执行（阻塞等待），直到它收到一个可以“向前推进”的信号（被唤醒）；
•将实现信号灯作用的变量称为信号量，常定义为记录型变量s，其一个域为整型，另一个域为队列，其元素为等待该信号量的阻塞进程(FIFO)。

使用信号量来实现互斥

•基本思想是将每个共享变量（或者一组相关的共享变量）与一个信号量s（初始为1）联系起来，然后用P和V操作将相应的临界区包围起来。
•几个概念

二元信号量：用这种方式来保护共享变量的信号量叫做二元信号量，取值总是0或者1.
互斥锁：以提供互斥为目的的二元信号量
加锁：对一个互斥锁执行P操作
解锁；对一个互斥锁执行V操作
计数信号量：被用作一组可用资源的计数器的信号量
禁止区：由于信号量的不变性，没有实际可能的轨迹能够包含禁止区中的状态。

利用信号量来调度共享资源

•信号量有两个作用：实现互斥；调度共享资源
•信号量分为：互斥信号量和资源信号量。

互斥信号量用于申请或释放资源的使用权，常初始化为1；
资源信号量用于申请或归还资源，可以初始化为大于1的正整数，表示系统中某类资源的可用个数。

•常见问题有生产者-消费者问题，和读者-写者问题

其他并发问题

•一个线程是安全的，当且仅当被多个并发线程反复的调用时，它会一直产生正确的结果。
•四个不相交的线程不安全函数类以及应对措施：

不保护共享变量的函数——用P和V这样的同步操作保护共享变量
保持跨越多个调用的状态的函数——重写，不用任何static数据。
返回指向静态变量的指针的函数——①重写；②使用加锁-拷贝技术。
调用线程不安全函数的函数——参考之前三种

可重入性

•当它们被多个线程调用时，不会引用任何共享数据。
•显式可重入的：所有函数参数都是传值传递，没有指针，并且所有的数据引用都是本地的自动栈变量，没有引用静态或全剧变量。
•隐式可重入的：调用线程小心的传递指向非共享数据的指针。
•一句话，就是使用线程不安全函数的可重入版本，名字以_r为后缀结尾。

竞争

•竞争发生的原因：一个程序的正确性依赖于一个线程要在另一个线程到达y点之前到达它的控制流中的x点。也就是说，程序员假定线程会按照某种特殊的轨迹穿过执行状态空间，忘了一条准则规定：线程化的程序必须对任何可行的轨迹线都正确工作。
•消除方法：动态的为每个整数ID分配一个独立的块，并且传递给线程例程一个指向这个块的指针

死锁

•一组线程被阻塞了，等待一个永远也不会为真的条件。

本周代码托管链接

https://git.oschina.net/Kevin_s/Linux_C.git

学习进度条

	代码行数（新增/累积）	博客量（新增/累积）	学习时间（新增/累积）
目标	5000行	30篇	400小时
第一周	200/200	2/2	20/20
第二周	300/500	2/4	18/38
第三周	500/1000	3/7	22/60
第四周	300/1300	2/9	30/90

《信息安全系统设计基础》 第十三周学习总结