Linux内核设计与实现 总结笔记(第九章)内核同步介绍

在使用共享内存的应用程序中,程序员必须特别留意保护共享资源,防止共享资源并发访问。

一、临界区和竞争条件

1.1 临界区和竞争条件

所谓临界区就是访问和操作共享数据代码段。多个执行线程并发访问同一个资源通常是不安全的,为了避免在临界区中并发访问,编程者必须保证这些代码原子地执行。

如果两个执行线程有可能处于同一个临界区中同时执行,如果这种情况确实发生了,我们就称它是竞争条件。因为竞争引起的错误非常不易重现,所以调试这种错误才会非常困难。

避免并发和防止竞争条件称为同步。

为什么要保护?

有些事务必须完整地发生,要么干脆不发生,但是绝不能打断。

二、加锁

锁提供的就是这种机制:它就如同一把门锁,门后的房间可想象成要给临界区。在一个指定的时间内,房间里只能有一个执行线程存在,当一个线程进入房间后,它会锁住身后的房门。当它结束对共享数据的操作后,就会走出房间,打开门锁。如果另一个线程在房门上锁时来了,那么它就必须等待房间内的线程出来并发开门锁后,才能进入房间。

线程持有锁,锁保护了数据。

2.1 造成并发执行的原因

内核中有类似可能造成并发执行的原因,它们是:

  • 中断----中断几乎可以在任何时刻异步发生,也就可能随时打断当前正在执行的代码
  • 软中断和tasklet----内核能在任何时刻唤醒或调度软中断和tasklet,打断当前正在执行的代码
  • 内核抢占----因为内核具有抢占型,所以内核中的任务可能会被另一任务抢占
  • 睡眠及与用户空间的同步----在内核执行的进程可能会睡眠,这就会唤醒调度程序,从而导致调度一个新的用户进程执行
  • 对称多处理----两个或多个处理器可以同时执行代码

真正困难的就是发现上述的潜在并发执行的可能,并有意识地采取某些措施来防止并发执行。

其实,真正用锁来保护共享资源并不困难,尤其是在设计代码的早期就这么做了,事情就更简单了。

辨认出真正需要共享的数据和响应的临界区,才是真正有挑战性的地方。

2.2 了解要保护些什么

找出哪些数据需要保护是关键所在。

线程中的局部数据仅仅被它访问,显然不需要保护。还有动态分配的数据结构,其地址在堆栈中。也不需要

大多数内核数据结构都需要加锁,

如果有其他执行线程可以访问这些数据,那么就给这些数据加上某种形式的锁。

如果任何其他什么东西都能看到它,那么就要锁住它。记住:要给数据而不是给代码加锁。

在编写代码时,你要问自己下面这些问题:

  • 这个数据是不是全局的?除了当前线程外,其他线程能不能访问它。
  • 这个数据会不会在进程上下文和中断上下文中共享?它是不是要在两个不同的中断处理程序中共享?
  • 进程在访问数据时可不可能被抢占?被调度的新程序会不会访问同一数据?
  • 当前进程是不是会睡眠(阻塞)在某些资源上,如果是,它会让共享数据处于核中状态?
  • 怎样防止数据失控?
  • 如果这个函数又在另一个处理器上被调度将会发生什么呢?
  • 如何确保代码原理并发威胁呢?

简而言之,所有内核全局变量和共享数据都需要某种形式的同步方法。

三、死锁

死锁产生需要一定条件:要有一个或多个执行线程和一个或多个资源,每个线程都在等待其中的一个资源,但所有资源都已经被占用了。

自死锁:一个执行线程试图去获得要给自己已经持有的锁,它将不得不等待锁被释放。最后智能死锁

一些简单的规则对避免死锁大有帮助:

  • 按顺序加锁,使用嵌套的锁时必须保证以相同的顺序获取锁,这样可以阻止致命拥抱类型的死锁。最好能记录下锁的顺序,以便其他人也能照此顺序使用
  • 防止发饥饿,这个代码是不是一定能执行结束?如果张不发生,王是否要一直等待下去
  • 不要重复请求同一个锁
  • 设计应力求简单----越复杂的加锁方案越有可能死锁

防止死锁很重要,内核提供了一些简单易用的调试工具,可以在运行时检测死锁。

四、争用和扩展性

锁的争用,简称争用,指当锁正在被占用时,有其他线程试图获得该锁。

当一个锁处于高度争用状态,会成为系统的瓶颈。尽管如此,也比多个进程抢夺资源要好。

锁的粒度,需要合理的安排。很多锁的设计在开始阶段都很粗,但是当锁争用问题严重时,设计就向更加精细的加锁方向进化。

原文地址:https://www.cnblogs.com/ch122633/p/11013358.html