Linux多线程编程

前言：有这样一道面试题（来自http://blog.csdn.net/morewindows/article/details/7392749）：

“编写一个程序，开启3个线程，这3个线程的ID分别为A、B、C，每个线程将自己的ID在屏幕上打印10遍，要求输出结果必须按ABC的顺序显示；如：ABCABC….依次递推。”

我们就从这样一题出发，认识多线程，了解其同步机制，最后正确解答这一类题目。本文框架如下：

进程与线程
多线程的优越性
线程基本函数
多线程同步
题目代码

一.进程与线程

进程的定义：进程是为了描述程序在并发执行时对系统资源的共享，所需的一个描述程序执行时动态特征的概念。进程是具有独立功能的程序关于某个数据集合上的一次运行活动，是系统进行资源分配、调度和保护的独立单位。

线程的定义：线程也成为轻量级进程，是进程中的一个运行实体，作为CPU的调度单位。一个进程由多个线程组成，线程与同属一个进程的其他的线程共享进程所拥有的全部资源。

同一进程内的所有线程除了共享全局变量外还共享：

进程指令；
大多数数据；
打开的文件（即描述符）；
信号处理函数和信号处置；
当前工作目录；
用户ID和组ID。

每个线程拥有各自的：

线程ID；
寄存器集合，包括程序计数器和栈指针；
栈（用于存放局部变量和返回地址）；
errno；
信号掩码；
优先级。

结构上的不同可以让我们更加了解进程和线程的相异之处：

（1）进程是资源分配的基本单位；线程与资源分配无关，它属于某一个进程，并与进程内的其他线程共享进程的资源。

（2）当进程发生调度时，不同的进程拥有不同的虚拟地址空间，而同一进程内的不同线程共享同一地址空间。

（3）线程只由先关堆栈（系统栈或用户栈）寄存器和线程控制块组成。寄存器用来存储线程内的局部变量，但不能存储其他线程的相关变量。

（4）进程切换时涉及有关资源指针的保存和地址空间的变化；线程切换时，由于处于同一进程内，所以不涉及资源信息的保存和地址空间的变化，从而减少了操作系统的时间开销。

二.多线程的优越性

在传统的UNIX模型中，当一个进程需要另一个实体来完成某事，它就fork一个子进程并让子进程去处理。但是fork的调用有如下缺点：

（1）fork的代价是昂贵的。fork要把父进程的内存印象复制到子进程，并在子进程中复制所有描述符等。

（2）fork返回之后父子进程之间信息的传递需要进程通信机制。调用fork之前父进程向尚未存在的子进程传递信息相当容易，因为子进程将从父进程数据空间及所有描述符的一个副本开始运行，但是从子进程向父进程返回信息却比较费力。

针对这两点，多线程技术相应而生，它具有如下优越性：

（1）它是一种非常"节俭"的多任务操作方式。而运行于一个进程中的多个线程，它们彼此之间使用相同的地址空间，共享大部分数据，启动一个线程所花费的空间远远小于启动一个进程所花费的空间，而且，线程间彼此切换所需的时间也远远小于进程间切换所需要的时间。

（2）线程间方便的通信更加方便。由于同一进程下的线程之间共享数据空间，所以一个线程的数据可以直接为其它线程所用，这不仅快捷，而且方便。但是，同一进程内的所有线程共享相同的全局内存，这样线程之间的通信就变得相当简单，随之而来的就是同步问题。

三.基本线程函数

1.pthread_create函数，创建线程

int pthread_create(pthread_t *tid, const pthread_attr_t *attr, void *(*func)(void *), void *arg);

pthread_t *tid：一个进程内的各个线程是由线程ID标识的，如果新线程创建成功，返回tid指针。

const pthread_attr_t *attr：每个线程有多个属性，包括优先级、初始栈大小、是否是一个守护线程等等。

void *(*func)(void *)：线程启动函数，线程从调用这个函数开始，或显示结束（调用pthread_exit()），或隐式结束（让该函数返回）。

void *arg：线程执行func函数的传递参数。

2.pthread_join函数，等待一个线程终止

int pthread_join(pthread_t *tid, void **status);

void **status：二级指针，如果status指针非空，那么所等待线程的返回值将存放在status指向的位置。

3.pthread_self函数，返回线程ID

int pthread_self(void);

跟进程比较，相当于getpid。

4.pthread_detach函数，线程分离

int pthread_detach(pthread_t tid);

线程或者是可汇合的（joinable），或者是脱离的（detach）。当可汇合的线程终止时，线程ID和退出状态将保留，知道另外一个线程调用pthread_join。脱离的线程终止时，释放所有的资源，因此我们不能等待它终止。若要一个线程知道另一个线程的终止时间，我们就要保留第二个线程的可汇合性。

5.pthread_exit函数，线程终止

int pthread_exit(void **status);

若线程未脱离，那么它的线程ID和退出状态将保留到另外一个线程调用pthread_join为止。

四.多线程的同步

有了上面的基本函数还不足以完成本题的要求，为什么呢？因为题目要求按照ABCABC...的方式打印，而3个线程却在抢占资源，所以无法控制排列顺序。这时就需要用到多线程编程中的同步技术。

对于多线程编程来说，同步就是同一时间只允许一个线程访问资源，而其他线程不能访问。多线程有3种同步方式：

互斥锁
条件变量
读写锁

1.互斥锁

互斥锁是最基本的同步方式，它用来保护一个“临界区”，保证任何时刻只由一个线程在执行其中的代码。这个“临界区”通常是线程的共享数据。

下面三个函数给一个互斥锁上锁和解锁：

int pthread_mutex_lock(pthread_mutex_t *mptr);

int pthread_mutex_trylock(pthread_mutex_t *mptr);

int pthread_mutex_unlock(pthread_mutex_t *mptr);

　　假设线程2要给已经被线程1锁住的互斥锁（mutex）上锁（即执行pthread_mutex_lock(mutex)），那么它将一直阻塞直到到线程1解锁为止（即释放mutex）。

如果互斥锁变量时静态分配的，通常初始化为常值PTHREAD_MUTEX_INITIALIZER，如果互斥锁是动态分配的，那么在运行时调用pthread_mutex_init函数来初始化。

2.条件变量

互斥锁用于上锁，而条件变量则用于等待，通常它都会跟互斥锁一起使用。

int pthread_cond_wait(pthread_cond_t *cptr,pthread_mutex_t *mptr);
int pthread_cond_signal(pthread_cond_t *cptr);

　　通常pthread_cond_signal只唤醒等待在相应条件变量上的一个线程，若有多个线程需要被唤醒呢，这就要使用下面的函数了：

int pthread_cond_broadcast(pthread_cond_t *cptr);

3.读写锁

互斥锁将试图进入连你姐去的其他简称阻塞住，而读写锁是将读和写作了区分，读写锁的分配规则如下：

（1）只要没有线程持有某个给定的读写锁用于写，那么任意数目的线程可以持有该读写锁用于读；

（2）仅当没有线程持有某个给定的读写锁用于读或用于写时，才能分配该读写锁用于写。

int pthread_rwlock_rdlock(pthread_relock_t *rwptr);
int pthread_rwlock_wrlock(pthread_relock_t *rwptr);
int pthread_rwlock_unlock(pthread_relock_t *rwptr);

五.题目代码

分析此题：

1.主线程main创建3个线程tid0，tid1，tid2；

2.设一个全局变量num，互斥锁mutex保护此临界区保证每次只有一个线程访问num；

3.若抢占到资源的线程tid并不是我们需要的，那么让它阻塞；

4.若抢占到资源的线程tid正好是我们需要的，那么就打印相应字母；

5.解锁，唤醒其他两个等待线程；

6.main函数等待3个线程打印结束才结束。

代码如下：

#include<stdio.h>
#include<stdlib.h>
#include<error.h>
#include<unistd.h>
#include<pthread.h>

int num=0;

static pthread_mutex_t mutex=PTHREAD_MUTEX_INITIALIZER;
static pthread_cond_t cond=PTHREAD_COND_INITIALIZER;

void *func(void *);

int main()
{
	pthread_t tid[3];
	int ret=0,i;
	for(i=0;i<3;i++)
		if((ret=pthread_create(&tid[i],NULL,func,(void*)i))!=0)
			printf("create thread_%c error
",i+'A');
   	for(i=0;i<3;i++)
		pthread_join(tid[i],NULL);
	printf("
");
	return 0;
}

void *func(void *argc)
{
	int i;
	for(i=0;i<10;i++)
	{
		pthread_mutex_lock(&mutex);
	    while(num!=(int)argc)
			pthread_cond_wait(&cond,&mutex);
		printf("%c",num+'A');
		num=(num+1)%3;
		pthread_mutex_unlock(&mutex);
		pthread_cond_broadcast(&cond);
	}
	pthread_exit(0);
}

参考资料：

1. 《UNIX网络编程卷2》

2.http://www.cnblogs.com/skynet/archive/2010/10/30/1865267.html

3.http://www.cnblogs.com/vamei/archive/2012/10/09/2715393.html