UNIX11-线程（上）

UNIX编程第11章

一个进程中所有线程都可以访问该进程的组成部件，如文件描述符和内存。

11.2 线程概念

典型的UNIX进程可以看成只有一个控制线程：一个在某一时刻只能做一件事情。有了多个控制线程以后，在程序设计时就可以把进程设计成在某一时刻能够做不止一件事，每个线程处理各自独立的任务。

-通过为每种事件类型分配单独的处理线程，可以简化处理异步事件的代码。每个线程在进行事件处理时可以采用同步编程模式，同步编程模式要比异步编程模式简单地多。

-多个进程必须使用操作系统提供的复杂机制才能实现内存和文件描述符的共享。而多个线程自动地可以访问相同的存储地址空间和文件描述符。

-有些问题可以分解从而提高整个程序的吞吐量。多线程时，独立的任务可以交叉进行，此时只需要为每个任务分配一个单独的线程。当然只有在两个任务的处理过程互不依赖的情况下，两个任务才可以交叉执行。

-交叉的程序同样可以通过使用多线程来改善响应时间，多线程可以把程序中处理用户输入输出的部分与其它部分分开。

每个线程都包含有表示执行环境所必需的信息，其中包括进程中标识线程的线程ID、一组寄存器值、栈、调度优先级和策略、信号屏蔽字、errno变量以及线程私有数据。

一个进程的所有信息对该进程的所有线程都是共享的，包括可执行程序的代码、程序的全局内存和堆内存、栈以及文件描述符。

POSIX线程的功能测试宏是_POSIX_THREADS。应用程序可以把这个宏用于#ifdef测试，从而在编译时确定是否支持线程。

11.3 线程标识

每个线程也有一个线程ID。进程ID在整个系统中是唯一的，但线程ID不同，线程ID只有在它所属的进程上下文中才有意义。

线程ID是用pthread_t数据类型来表示的，实现的时候可以用一个结构来代表pthread_t数据类型，所以可移植的操作系统实现不能把它作为整数处理。因此必须使用一个函数来对两个线程ID进行比较。

#include<pthread.h>

int pthread_equal(pthread_t tid1, pthread_t tid2);

　　返回值：若想等，返回非0数值，否则返回0

线程可以调用pthread_self函数获得自身的线程ID：

#include<pthread.h>

pthread_t pthread_self(void);

　　返回值：调用线程的线程ID

11.4 线程创建

在POSIX线程的情况下，程序开始运行时，它也是以单进程中的单个控制线程启动的。在创建多个控制县城以前，程序的行为与传统的进程并没有什么区别。新增的线程可以通过调用pthread_create函数创建：

#include<pthread.h>

int phread_create(pthread_t *restrict tidp, const pthread_attr_t *restrict attr, void *(*start_rtn)(void *), void *restrict arg);

　　返回值：若成功，返回0；否则返回错误编号

当pthread_create成功返回时，新创建线程的线程ID会被设置为tidp指向的内存单元。attr参数用于定制各种不同的县线程属性。设置attr为NULL，创建一个具有默认属性的线程。

新创建的线程从start_rtn函数的地址开始运行，该函数只有一个无类型指针参数arg。如果需要向start_rtn函数传递的参数有一个以上，那么需要把这些参数放到一个结构中，然后把这个结构的地址作为arg参数传入。

线程创建时并不能保证哪个线程会先运行：是新创建的线程还是调用线程。新创建的线程可以访问进程的地址空间，并且继承调用线程的浮点环境和信号屏蔽字，但是该线程的挂起信号集会被清除。

注意pthread函数在调用失败时通常会返回错误码，不会设置errno。

Linux线程ID是用无符号长整型来表示的。

11.5 线程终止

如果进程中的任意线程调用了exit、_Exit或者_exit，那么整个进程就会终止。与此相似，如果默认的动作是终止进程，那么发送到线程的信号就会终止整个进程。

单个线程可以通过3种方式退出，因此可以在不终止整个进程的情况下，停止它的控制流：

-线程可以简单地从启动例程中返回，返回值是线程的退出码。

-线程可以被同一进程中的其它线程取消。

-线程可以调用pthread_exit。

#include<pthread.h>

void pthread_exit(void *rval_ptr);

rval_ptr参数是一个无类型指针，与传给启动例程的单个参数类似。进程中的其它线程也可以通过调用pthread_join函数访问到这个指针。

#include<pthread.h>

int pthread_join(pthread_t thread, void **rval_ptr);

　　返回值：若成功，返回0；失败返回错误编号；

调用线程将一直阻塞，直到指定的线程调用pthread_exit、从启动例程中返回或者被取消。如果线程简单地从它的启动例程返回，rval_ptr就包含返回码。如果线程被取消，由rval_ptr指定的内存单元就设置为PTHREAD_CANCELED。

可以通过调用pthread_join自动把线程置于分离状态，这样资源就可以恢复。如果线程已经处于分离状态，pthread_join调用就会失败，返回EINVAL，尽管这种行为是与具体实现相关的。

如果对线程的返回值并不感兴趣，那么可以把rval_ptr设置为NULL。这种情况下，调用pthread_join函数可以等待指定的线程终止，但并不获取线程的终止状态。

当一个线程通过调用pthread_exit退出或者简单地从启动例程中返回时，进程中的其它线程可以通过调用pthread_join函数获得该线程的退出状态。

pthread_create和pthread_exit函数的无类型指针参数可以传递的值不止一个，这个指针可以传递包含复杂信息的结构地址，但是这个结构所使用的内存在调用者完成调用以后必须是有效的。

线程可以通过调用pthread_cancel函数来请求取消同一进程中的其它线程。

#include<pthread.h>

int pthread_cancel(pthread_t tid);

　　返回值：若成功，返回0；若失败返回错误编号；

在默认情况下，pthread_cancel函数会使得由tid标识的线程行为如同调用了参数为PTHREAD_CANCELED的pthread_exit函数，但是，线程可以选择忽略取消或者控制如何被取消。注意pthread_cancel并不等待线程终止，它仅仅提出请求。

线程可以安排它退出时需要调用的函数，这与进程在退出时可以用atexit函数安排退出是类似的。这样的函数称为线程清理处理程序。一个线程可以建立多个清理处理程序。处理程序记录在栈中，也就是说，它们的执行顺序与它们注册时相反。

#include<pthread.h>

void pthread_cleanup_push(void (*rtn) (void *), void *arg);

void pthread_cleanup_pop(int execute);

当线程执行以下动作时，清理函数rtn是由pthread_cleanup_push函数调度的，调用时只有一个参数arg：

-调用pthread_exit时；

-响应取消请求时；

-用非零execute参数调用pthread_cleanup_pop时。

如果execute参数设置为0，清理函数将不被调用。不管发生上述哪种情况，pthread_cleanup_pop都将删除上次pthread_cleanup_push调用建立的清理处理程序。

在默认情况下，线程的终止状态会保存直到对该线程调用pthread_join。如果线程已经被分离，线程的底层存储资源可以在线程终止时立即被收回。在线程被分离后，我们不能用pthread_join函数等待它的终止状态，因为对分离状态的线程调用pthread_join会产生未定义行为。

可以调用pthread_detach分离线程：

#include<pthread.h>

int pthread_detach(pthread_t tid);

　　返回值：若成功返回0，否则返回错误编号；

11.6 线程同步

11.6.1 互斥量

可以使用pthread互斥接口来保护数据，确保同一时间只有一个线程访问数据。互斥量mutex从本质上说是一把锁，在访问共享资源前对互斥量进行设置（加锁），在访问完成后释放（解锁）互斥量。对互斥量进行加锁以后，任何其它试图再次对互斥量加锁的线程都会被阻塞直到当前线程释放该互斥锁。如果释放互斥量时有一个以上的线程阻塞，那么所有该锁上的阻塞线程都会变成可运行状态，第一个变为运行的线程就可以对互斥量加锁，其它线程就会看到互斥量依然是锁着的，只能回去再次等待它重新变为可用。

互斥变量是用pthread_mutex_t数据类型表示的。在使用互斥变量以前，必须首先对它进行初始化，可以把它设置为常量PTHREAD_MUTEX_INITIALIZER（只适用于静态分配的互斥量），也可以通过调用pthread_mutex_init函数进行初始化。如果动态分配互斥量（例如malloc），在释放内存前需要调用pthread_mutex_destroy。

#include<pthread.h>

int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t *restrict attr);

int pthread_mutex_destroy(pthread_mutex_t *mutex);

　　两个函数的返回值：若成功返回0，否则返回错误编号；

要用默认的属性初始化互斥量，只需把attr设为NULL。

对互斥量进行加锁，需要调用pthread_mutex_lock。如果互斥量已经上锁，调用线程将阻塞直到互斥量被解锁。对互斥量解锁，需要调用pthread_mutex_unlock。

#include<pthread.h>

int pthread_mutex_lock(pthread_mutex_t *mutex);

int pthread_mutex_trylock(pthread_mutex_t *mutex);

int pthread_mutex_unlock(pthread_mutex_t *mutex);

　　所有函数的返回值：若成功返回0，否则返回错误编号；

如果线程不希望被阻塞，它可以使用pthread_mutex_trylock尝试对互斥量进行加锁。如果调用pthread_mutex_trylock时互斥量处于未锁住状态，那么pthread_mutex_trylock将锁住互斥量，不会出现阻塞直接返回0，否则pthread_mutex_trylock就会失败，不能锁住互斥量，返回EBUSY。

11.6.3 函数pthread_mutex_timedlock

当线程试图获取一个已加锁的互斥量时，pthread_mutex_timedlock互斥量原语允许绑定线程阻塞时间。pthread_mutex_timedlock函数与pthread_mutex_lock是基本等价的，但是在达到超时时间值时，pthread_mutex_timedlock不会对互斥量进行加锁，而是返回错误码ETIMEDOUT。

#include<pthread.h>

#include<time.h>

int pthread_mutex_timedlock(pthread_mutex_t *restrict mutex, const struct timespec *restrict tsptr);

　　返回值：若成功返回0，否则返回错误编号；

超时指定愿意等待的绝对时间。这个超时时间是用timespec结构来表示的，它用秒和纳秒来描述时间。

11.6.4 读写锁

读写锁有3种状态：读模式下加锁，写模式下加锁，不加锁状态。一次只有一个线程可以占有写模式的读写锁，但是多个线程可以同时占有读模式的读写锁。

读写锁非常适合对数据结构读的次数远大于写的情况。读写锁也叫共享互斥锁，当读写锁是读模式锁住时，就可以说是以共享模式锁住的，当它是写模式锁住的时候，就可以说是以互斥模式锁住的。

#include<pthread.h>

int pthread_rwlock_init(pthread_rwlock_t *restrict rwlock, const pthread_rwlockattr_t *restrict attr);

int pthread_rwlock_destroy(pthread_rwlock_t *rwlock);

　　两个函数的返回值：若成功返回0，失败返回错误编号；

读写锁通过调用pthread_rwlock_init进行初始化。如果希望读写锁有默认的属性，可以传一个null指针给attr。

在释放读写锁占用的内存之前，需要调用pthread_rwlock_destroy做清理工作。如果pthread_rwlock_init为读写锁分配了资源，pthread_rwlock_destroy将释放这些资源。如果在调用pthread_rwlock_destroy之前就释放了读写锁占用的内存空间，那么将分配给这个锁的资源就会丢失。

要在读模式下锁定读写锁，需要调用pthread_rwlock_rdlock。要在写模式下锁定读写锁，需要调用pthread_rwlock_wrlock。不管以何种方式锁住读写锁，都可以调用pthread_rwlock_unlock进行解锁。

#include<pthread.h>

int pthread_rwlock_rdlock(pthread_rwlock_t *rwlock);

int pthread_rwlock_wrlock(pthread_rwlock_t *rwlock);

int pthread_rwlock_unlock(pthread_rwlock_t *rwlock);

　　所有函数的返回值：若成功，返回0；否则返回错误编号；

各种实现可能会对共享模式下可获取的读写锁的次数进行限制，所以需要检查pthread_rwlock_rdlock的返回值。另外两个函数如果设计合理则通常不须检查。

错误返回值的定义只是针对不正确使用读写锁的情况（如未经初始化的锁），或者试图获取已拥有的锁从而可能产生死锁的情况。

#include<pthread.h>

int pthread_rwlock_tryrdlock(pthread_rwlock_t *rwlock);

int pthread_rwlock_trywrlock(pthread_rwlock_t *rwlock);

　　两个函数的返回值：若成功，返回0；否则返回错误编号；

可以获取锁时，这两个函数返回0.否则，它们返回错误EBUSY。

11.6.5 带有超时的读写锁

#include<pthread.h>

#include<time.h>

int pthread_rwlock_timedrdlock(pthread_rwlock_t *restrict rwlock, const struct timespec *restrict tsptr);

int pthread_rwlock_timedwrlock(pthread_rwlock_t *restrict rwlock, const struct timespec *restrict tsptr);

　　两个函数的返回值：若成功，返回0；否则返回错误编号；

11.6.6 条件变量

条件变量是线程可用的另一种同步机制。条件变量给多个线程提供了一个会和的场所。条件变量与互斥量一起使用时，允许线程以无竞争的方式等待特定的条件发生。

条件本身是由互斥量保护的。线程在改变条件状态之前必须首先锁住互斥量。其它线程在获得互斥量之前不会察觉到这种改变，因为互斥量必须在锁定以后才能计算条件。

在使用条件变量之前，必须先对它进行初始化。由pthread_cond_t数据类型表示的条件变量可以用两种方式进行初始化，可以把常量PTHREAD_COND_INITIALIZER赋给静态分配的条件变量，但是如果条件变量是动态分配的，则需要使用pthread_cond_init函数对它进行初始化。

在释放条件变量底层的内存空间之前，可以使用pthread_cond_destroy函数对条件变量进行反初始化。

#include<pthread.h>

int pthread_cond_init(pthread_cond_t *restrict cond, const pthread_condattr_t *restrict attr);

int pthread_cond_destroy(pthread_cond_t *cond);

　　两个函数的返回值：若成功，返回0；否则返回错误编号。

除非需要创建一个具有非默认属性的条件变量，否则pthread_cond_init函数的attr参数可以设置为NULL。

我们使用pthread_cond_wait等待条件变量变为真。如果在给定的时间内条件不能满足，那么会生成一个返回错误码的变量。

#include<pthread.h>

int pthread_cond_wait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex);

int pthread_cond_timedwait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex, const struct timespec *restrict tsptr);

　　两个函数的返回值：若成功，返回0；否则返回错误编号；

传递给pthread_cond_wait的互斥量对条件进行保护。调用者把锁住的互斥量传给函数，函数然后自动把调用线程放到等待条件的线程列表上，对互斥量解锁（这两步是原子操作）。pthread_cond_wait返回时，互斥量再次被锁住。

pthread_cond_timedwait函数的功能与pthread_cond_wait函数相似，只是多了一个超时（tsptr）。超时值指定了我们愿意等待多长时间，它是通过timespec结构指定的。

如果超时到期时条件还是没有出现，pthread_cond_timedwait将重新获取互斥量，然后返回错误ETIMEDOUT。从pthread_cond_wait或者pthread_cond_timedwait调用成功返回时，线程需要重新计算条件，因为另一个线程可能已经在运行并改变了条件。

有两个函数可以用于通知线程条件已经满足。pthread_cond_signal函数至少能唤醒一个等待该条件的线程，而pthread_cond_broadcast函数则唤醒等待该条件的所有线程。

#include<pthread.h>

int pthread_cond_signal(pthread_cond_t *cond);

int pthread_cond_broadcast(pthread_cond_t *cond);

　　两个函数的返回值：若成功，返回0；否则返回错误编号；

11.6.7 自旋锁

自旋锁与互斥量类似，但它不是通过休眠使进程阻塞，而是在获取锁之前一直处于忙等阻塞状态。

可以用pthread_spin_init函数对自旋锁进行初始化。用pthread_spin_destroy函数进行自旋锁的反初始化。

#include<pthread.h>

int pthread_spin_init(pthread_spinlock_t *lock, int pshared);

int pthread_spin_destroy(pthread_spinlock_t *lock);

　　两个函数的返回值：若成功，返回0；否则返回错误编号；

只有一个属性是自旋锁特有的，这个属性只在支持线程进程共享同步选项的平台上才用得到。pshared参数表示进程共享属性，表明自旋锁是如何获取的。如果它设为PTHREAD_PROCESS_SHARED，则自旋锁能被可以访问锁底层内存的线程所获取，即便那些线程属于不同的进程，情况也是如此。否则pshared参数设为PTHREAD_PROCESS_PRIVATE，自旋锁就只能被初始化该锁的进程内部的线程所访问。

可以用pthread_spin_lock或pthread_spin_trylock对自旋锁进行加锁，前者在获取锁之前一直自旋，后者如果不能获取锁，就立即返回EBUSY错误。pthread_spin_trylock不能自旋。不管以何种方式加锁，自旋锁都可以调用pthread_spin_unlock函数解锁。

#include<pthread.h>

int pthread_spin_lock(pthread_spinlock_t *lock);

int pthread_spin_trylock(pthread_spinlock_t *lock);

int pthread_spin_unlock(pthread_spinlock_t *lock);

　　所有函数的返回值：若成功，返回0；否则返回错误编号；

11.6.8 屏障（感觉像Linux内核中的信号量）

屏障是用户协调多个线程并行工作的同步机制。屏障允许每个线程等待，直到所有的合作县城都到达某一点，然后从该点继续执行。pthread_join函数就是一种屏障，允许一个线程等待，直到另一个线程退出。

屏障允许任意数量的线程等待，直到所有的线程完成处理工作。而线程不需要退出，所有线程到达屏障后可以接着工作。

可以使用pthread_barrier_init函数对屏障进行初始化，用pthread_barrier_destroy函数反初始化。

#include<pthread.h>

int pthread_barrier_init( pthread_barrier_t *restrict barrier, const pthread_barrierattr_t *restrict attr, unsigned int count);

int pthread_barrier_destroy(pthread_barrier_t *barrier);

　　两个函数的返回值：若成功，返回0；否则返回错误编号；

初始化屏障时，可以使用count参数指定，在允许所有线程继续运行之前，必须到达屏障的线程数目。使用attr参数指定屏障对象的属性。attr设置为NULL默认初始化屏障。

可以使用pthread_barrier_wait函数来表明，线程已经完成工作，准备等其它线程赶上来。

#include<pthread.h>

int pthread_barrier_wait( pthread_barrier_t *barrier);

　　返回值：若成功，返回0或者PTHREAD_BARRIER_SERIAL_THREAD；否则返回错误编号；

调用pthread_barrier_wait的线程在屏障计数（调用pthread_barrier_init时设定）未满足条件时，会进入休眠状态。如果该线程是最后一个调用pthread_barrier_wait的线程，就满足了屏障计数，所有的线程都会被唤醒。

对于一个任一线程，pthread_barrier_wait函数返回了PTHREAD_BARRIER_SERIAL_THREAD。剩下的线程看到的返回值都是0。这使得一个线程可以作为主线程，它可以工作在其它所有线程已完成的工作结果上。

一旦达到屏障计数值，而且线程处于非阻塞状态，屏障就可以被调用。

PS：一个进程中有一个主线程和多个工作线程，主线程create的工作线程都会在执行函数中执行pthread_barrier_wait函数，主线程本身也执行pthread_barrier_wait函数。此时没有规定调用顺序，主线程相对工作线程可前可后达到pthread_barrier_wait并进行休眠，直到休眠的线程数到达在屏障init时的count数值。为了为了确定主线程，pthread_barrier_wait的返回值为PTHREAD_BARRIER_SERIAL_THREAD的线程唯一（且就是主线程？？），其它线程的pthread_barrier_wait返回值为0（这些是工作线程？？）。且主线程会在所有工作线程都执行完后才会执行。

（以上略存疑。。）