《Linux应用多线程(一) — 线程的概念及实现》

1.线程的定义

  线程:线程是进程中的一个独立的代码块。说白了,其实它就是个函数,只不过再也不用像以前的函数调用来调用它。而是通过pthread_create函数来创建它,也就是告诉内核,这个函数是个线程,今后交给你来调度了。

  如果从以上的定义来看,那么很明显,线程是拥有自己的栈空间(局部变量),但是共享全局变量、文件描述符等。

  注意:这边区别一下和fork系统调用创建出来的进程进行一下比较:fork创建出的是一个新的进程,因此他拥有自己的变量和PID,而不需要和父进程进行共享。

  Linux系统中线程的实现是基于pthread线程库的,pthread在不同的linux kernel版本中是不同的,大体上以linux 2.6为分界,linux 2.6以前的linux版本的线程库采用的是linux Threads线程库,linux 2.6开始的linux版本采用NTPL线程库。

  针对linux Threads线程库以及NTPL线程库就不过多的解释了,主要目前用的基本都是NTPL线程库就行了。

2.多线程编程的优缺点

对于大多数合作性任务,多线程比多个独立的进程更优越呢?

  这是因为,线程共享相同的内存空间。不同的线程可以存取内存中的同一个变量。所以,程序中的所有线程都可以读或写声明过的全局变量。如果曾用 fork() 编写过重要代码,就会认识到这个工具的重要性。为什么呢?虽然 fork() 允许创建多个进程,但它还会带来以下通信问题: 如何让多个进程相互通信,这里每个进程都有各自独立的内存空间。

  对这个问题没有一个简单的答案。虽然有许多不同种类的本地 IPC (进程间通信),但它们都遇到两个重要障碍:

  • 强加了某种形式的额外内核开销,从而降低性能。
  • 对于大多数情形,IPC 不是对于代码的“自然”扩展。通常极大地增加了程序的复杂性。

  由于所有的线程都驻留在同一内存空间,POSIX 线程无需进行开销大而复杂的长距离调用。只要利用简单的同步机制,程序中所有的线程都可以读取和修改已有的数据结构。而无需将数据经由文件描述符转储或挤入紧窄的共享内存空间。仅此一个原因,就足以让您考虑应该采用单进程/多线程模式而非多进程/单线程模式。

优点:

    1、无需跨进程边界

    2、程序逻辑和控制方式简单

    3、所有线程可以直接共享内存和变量等

    4、线程方式消耗的总资源比进程方式少

缺点:

    1、每个线程与主程序共用地址空间,受限于2GB地址空间

    2、线程之间的同步和加锁控制比较麻烦

    3、一个线程的崩溃可能影响到整个程序的稳定性

    4、到达一定的线程数程度后,即使再增加CPU也无法提高性能

    5、线程能够提高的总性能有限,而且线程数量较大时,线程本身的调度开销不小

3.线程函数

3.1 pthread_create

#include <pthread.h>

int pthread_create(pthread_t *thread, pthread_attr_t *attr, void*(*start_routine)(void*), void *arg);
作用:创建一个新的线程。
  • 第一个参数:只想pthread_t类型数据的指针,线程被创建时,这个指针所指向的变量将会被写入一个标识符,用于后面对线程的引用。
  • 第二个参数:用于设置线程的属性,如果不需要设置线程的属性,直接设置参数为NULL。
  • 第三个参数:执行的代码函数。
  • 第四个参数:传递给该函数的参数。
  • 返回值:成功返回0,失败返回错误代码

  线程创建时,并不能保证哪个线程会先运行。

实例:

#include <pthread.h>

pthread_t ntid;

void printfs(const char *s)
{
  pid_t pid;
  pthread_t tid;

  pid = getpid();
  tid = pthread_self();  //获取当前线程的ID
  printf("%s pid %lu tid %lu (0x%1x) 
", s,(unsigned long) pid, (unsigned long)tid, (unsigned long)tid);  
}

void *thr_fn(void *arg)
{
  printfs("new thread:");
  return((void *) 0);
}

int main(void)
{
  int err;
  err = pthread_create(&ntid, NULL, thr_fn, NULL);
  if(err != 0)
       err_exit(err, "can't create thread");
  printfs("main thread:"); 
  sleep(1); 
  exit(0);    
}

以上例程有两个需要注意的点:

  • 需要特别注意主线程和新线程的竞争(线程创建时,并不能保证哪个线程会先运行),所以目前这里采用的主线程休眠一秒,如果主线程不休眠,并且是主线程先运行,那么久会直接exit,新线程就没有运行的机会。
  • 新线程是通过pthread_self来获取自己的线程ID。而不是通过ntid。因为主线程通过pthread_create创建新线程,会把新线程的ID存在放第一个参数也就是ntid上。但是新建的线程并不能安全的使用它。理由是:如果新线程在主线程调用pthread_create返回之前就运行了。那么新线程看到的是未初始化的ntid内容,这个内容并不是正确的线程ID。

导致以上两个特别需要注意的原因都是线程创建时,并不能保证哪个线程会先运行。

3.2 pthread_exit

  如果进程中的任意线程调用了exit、_Exit或者_exit,那么整个进程就会终止(注意,不要在某个线程调用这几个退出函数,因此一旦某个线程调用,那么进程就会退出,而一个进程中通过有多个线程,这样会导致其他线程也一起退出)。

  单个线程在不终止整个进程的情况下可以通过三种方式退出:

  • 线程可以简单地从启动例程中返回(函数运行结束退出),返回值是线程的退出码(return)。
  • 线程可以被同一进程中的其他线程取消。
  • 线程调用pthread_exit。
#include <pthread.h>

void pthread_exit(void *retval)

  作用:终止调用它的线程并返回一个指向某个对象的指针(即void *retval)。

  注意:绝不能用它返回一个指向局部变量的指针,因为线程调用该函数后,局部变量就将不存在,就会引起严重的程序问题。

3.3 pthread_join

#include <pthread.h>

int thread_join(pthread_t th, void **thread_return);
作用:等价于进程中用来收集子进程信息的wait函数。

  第一个参数:指定将要等待的线程。

  第二个参数:这个参数是一个指针,它指向另一个指针,后者指向线程的返回值。这边主要用于同步,即上面的pthread_exit结束完当前的线程会返回他参数里面的数据给pthread_join,然后在主线程中可以调用这个数据。

  当一个线程通过调用pthread_exit退出或者简单从启动例程中返回时,进程中的其他线程可以通过使用pthread_join函数获得该线程的退出状态。

  pthread_create和pthread_exit函数的无类型指针参数可以传递的值不止一个,这个指针可以传递包含复杂信息的结构的地址。但是注意,这个结构所使用的内存在调用者完成调用以后必须仍然有效。例如:在调用线程的栈上分配了该结构,那么其他的线程在使用这个结果的时候内存内容可能已经改变了。又比如:线程在自己的栈上分配了一个结构,然后把指向这个结构的指针传给pthread_exit,那么调用pthread_join的线程试图使用该结构时,这个栈有可能已经被撤销。

  由于一个进程中的多个线程是共享数据段的,因此通常在线程退出之后,退出线程所占用的资源并不会随着线程的终止而得到释放。pthread_join可以用于将当前线程挂起,等待线程的结束。这个函数是一个线程阻塞的函数,调用它的函数将一直被等待的线程结束为止,当函数返回时,被等待线程的资源就被收回。

3.4  pthread_cancel

#include <pthread.h>

int pthread_cancel(pthread_t tid);
返回值: 成功:0;  失败:返回错误编号

  线程可以通过调用pthread_cancel函数来请求取消同一进程中的其他线程。

  在默认情况下,pthread_cancel函数会使得由tid标识的线程的行为表现为如同调用了参数为PTHREAD_CANCELED的pthread_exit函数。但是,线程可以选择忽略取消或者控制如何被取消。需要特别注意的是:pthread_cancel并不等待线程终止,它仅仅提出请求。

  

原文地址:https://www.cnblogs.com/zhuangquan/p/13180668.html