并发和竞态

（一）基本概念

对并发的管理是操作系统编程领域中的核心问题之一。

设备驱动程序开发者必须在开始设计时就考虑到并发因素，并对内核提供的并发管理机制有深刻的认识。

竞态：竞争状态；

引发竞态的原因是：并发式访问同一共享资源：

①多线程并发访问；

②抢占式并发访问；

③中断程序并发访问；

④SMP(Symmetric Multi-Processing)核间并发访问；

竞态造成的影响：处于竞态中的任务，所获得资源与预期不符，从而产生非预期的结果。

设计驱动程序的规则：

①尽可能避免资源共享，最明显的应用就是避免使用全局变量；

②在单个执行线程之外共享硬件或者软件资源的任何时候，必须显式地管理对该资源的访问，确保一次只有一个执行线程可操作共享资源；

③当内核代码创建了一个可能和内核的其他部分共享的对象时，该对象必须在还有其他组件引用自己时保持存在并正确工作；在对象还不能正确工作时，不能将其对内核可用；

（二）信号量和互斥体

信号量分为：计数型信号量和二值信号量，二值信号量也称作互斥体。

目的：建立临界区，确保在任意时刻，临界区只被一个任务访问。

一个信号量的本质就是一个整数，它和一对函数联合使用，这对函数通常被称为P和V。

Linux内核中几乎所有的信号量均用户互斥。（因此，只要知道，计数型信号量的原理与停车场相似即可。）

如果在拥有一个信号量时发生错误，必须在将错误状态返回给调用者前释放该信号量。

信号的机制会使等待信号量的任务进入休眠，因此：

①信号量适用于占用资源比较久的场合（资源占用时间短，频繁切换任务引起的开销远大于信号量带来的优势）；

②信号量不可用于中断（中断不能休眠）；

Linux信号量的实现

.linux-2.6.22.6_vscodeincludeasm-avr32semaphore.h

声明和初始化一个互斥体：

（静态）

1 #define DECLARE_MUTEX(name) __DECLARE_SEMAPHORE_GENERIC(name,1)
2 #define DECLARE_MUTEX_LOCKED(name) __DECLARE_SEMAPHORE_GENERIC(name,0)

（动态）

1 void init_MUTEX (struct semaphore *sem);
2 void init_MUTEX_LOCKED (struct semaphore *sem);

申请信号量：

1 /*
2 * This is ugly, but we want the default case to fall through.
3 * "__down_failed" is a special asm handler that calls the C
4 * routine that actually waits. See arch/i386/kernel/semaphore.c
5 */
6 static inline void down(struct semaphore * sem);
7
8
9 /*
10 * Interruptible try to acquire a semaphore. If we obtained
11 * it, return zero. If we were interrupted, returns -EINTR
12 */
13 static inline int down_interruptible(struct semaphore * sem);
14
15
16 /*
17 * Non-blockingly attempt to down() a semaphore.
18 * Returns zero if we acquired it
19 */
20 static inline int down_trylock(struct semaphore * sem);

释放信号量：

1 /*
2 * Note! This is subtle. We jump to wake people up only if
3 * the semaphore was negative (== somebody was waiting on it).
4 * The default case (no contention) will result in NO
5 * jumps for both down() and up().
6 */
7 static inline void up(struct semaphore * sem);

读取者/写入者信号量

.linux-2.6.22.6_vscodeincludelinux wsem.h

使用情景：很少需要写访问，并且写入者只会短期拥有信号量（避免读取者"饿死"）。

1 /*
2 * lock for reading
3 */
4 extern void down_read(struct rw_semaphore *sem);
5
6 /*
7 * trylock for reading -- returns 1 if successful, 0 if contention
8 */
9 extern int down_read_trylock(struct rw_semaphore *sem);
10
11 /*
12 * lock for writing
13 */
14 extern void down_write(struct rw_semaphore *sem);
15
16 /*
17 * trylock for writing -- returns 1 if successful, 0 if contention
18 */
19 extern int down_write_trylock(struct rw_semaphore *sem);
20
21 /*
22 * release a read lock
23 */
24 extern void up_read(struct rw_semaphore *sem);
25
26 /*
27 * release a write lock
28 */
29 extern void up_write(struct rw_semaphore *sem);
30
31 /*
32 * downgrade write lock to read lock
33 */
34 extern void downgrade_write(struct rw_semaphore *sem);

（三）Completion

内核编程的一种常见模式是，在当前线程之外初始化某个活动，然后等待该活动的结束。

（轻量级机制，允许一个线程告诉另一个线程某个工作已完成。）

典型应用：模块退出时，内核线程终止。

.linux-2.6.22.6_vscodeincludelinuxcompletion.h

声明和初始化Completion：

（静态）

1 #define DECLARE_COMPLETION(work)
2 struct completion work = COMPLETION_INITIALIZER(work)

（动态）

1 static inline void init_completion(struct completion *x);

等待Completion事件：

1 extern void FASTCALL(wait_for_completion(struct completion *));
2 extern int FASTCALL(wait_for_completion_interruptible(struct completion *x));
3 extern unsigned long FASTCALL(wait_for_completion_timeout(struct completion *x,
4 unsigned long timeout));
5 extern unsigned long FASTCALL(wait_for_completion_interruptible_timeout(
6 struct completion *x, unsigned long timeout));

发出Completion事件：

1 extern void FASTCALL(complete(struct completion *));
2 extern void FASTCALL(complete_all(struct completion *));

如果发出的事件是complete_all事件，那么这个complete在被使用后丢弃，如需继续使用，在发出下个事件前，需要重新初始化：

1 #define INIT_COMPLETION(x) ((x).done = 0)

（四）自旋锁

自旋锁可以在不能休眠的进程中使用，比如中断处理例程。

自旋锁是一个互斥设备。

自旋锁最初是为了在多处理器系统上使用而设计的。

"自旋"：等待自旋锁的进程进入忙循环并重复检查这个锁，直到该锁可用为止。

必须遵守的规则：

①任何拥有自旋锁的代码都必须是原子的。

②任何拥有自旋锁的代码不能休眠。

③在拥有自旋锁时禁止中断（仅在本地CPU上）。

.linux-2.6.22.6_vscodeincludelinuxspinlock.h

初始化自旋锁：

（静态）

1 /*
2 * SPIN_LOCK_UNLOCKED and RW_LOCK_UNLOCKED defeat lockdep state tracking and
3 * are hence deprecated.
4 * Please use DEFINE_SPINLOCK()/DEFINE_RWLOCK() or
5 * __SPIN_LOCK_UNLOCKED()/__RW_LOCK_UNLOCKED() as appropriate.
6 */
7 #define SPIN_LOCK_UNLOCKED        __SPIN_LOCK_UNLOCKED(old_style_spin_init)
8 #define RW_LOCK_UNLOCKED        __RW_LOCK_UNLOCKED(old_style_rw_init)
9
10 #define DEFINE_SPINLOCK(x)        spinlock_t x = __SPIN_LOCK_UNLOCKED(x)
11 #define DEFINE_RWLOCK(x)         rwlock_t x = __RW_LOCK_UNLOCKED(x)

（动态）

1 spin_lock_init(spinlock_t *lock);

申请锁资源：

1 spin_lock(spinlock_t *lock);

1 spin_lock_irq(spinlock_t *lock);
2 spin_lock_irqsave(spinlock_t *lock, flags); //flags:irq flag
3 spin_lock_bh(spinlock_t *lock);

非阻塞式申请：

1 spin_trylock(spinlock_t *lock);
2 spin_trylock_bh(spinlock_t *lock);
3 spin_trylock_irq(spinlock_t *lock);
4 spin_trylock_irqsave(spinlock_t *lock, flags);

释放锁资源：

1 spin_unlock(spinlock_t *lock);
2 spin_unlock_irq(spinlock_t *lock);
3 spin_unlock_irqrestore(spinlock_t *lock, flags);
4 spin_unlock_bh(spinlock_t *lock);

读取者/写入者锁

这种锁允许任意数量的读取者同时进入临界区，但是写入者必须互斥访问。

与resem类似，避免读取者"饥饿"。

接口请看：

.linux-2.6.22.6_vscodeincludelinuxspinlock.h

（五）锁陷阱——针对前面的小节

如果某个获得锁的函数要调用其他同样尝试获取这个锁的函数，我们的代码就会死锁。

无论是信号量还是自旋锁，都不允许锁拥有者第二次获得这个锁，如果试图这么做，系统将挂起。

提供给外部调用的函数，必须显式地处理锁定。

在必须获取多个锁时，应该始终以相同的顺序获得；这里的相同顺序是指所有进程获得锁的顺序应该统一；避免死锁。

如果我们必须获得一个局本锁（比如一个设备锁），以及一个属于内核更中心位置的锁，则首先获取自己的局部锁。

最好的办法就是，避免出现需要多个锁的情况。

（六）循环缓冲区（circular buffer）

目的：从根本上避免使用锁，避免竞态。

要求：写入者看到的数据结构始终和读取者看到的保持一致。

实现：构造一个环形缓冲区：一个数组、两个指针（一个记录读、一个记录写）。

只要写入者在更新写入索引值之前，将新的值保存到缓冲区，则读取者将始终看到一致的数据结构（注意重叠、超前等问题）。

（七）原子变量

针对共享资源是一个整数的情形，为了节省开销，内核提供了一种原子的整数类型，称为atomic_t。

atomic_t变量中不能记录大于24位的整数。

.linux-2.6.22.6_vscodeincludeasm-armatomic.h

（八）位操作

为了实现位操作，内核提供了一组可原子地修改和测试单个位地函数。

不幸的是，这些函数依赖于具体的架构。

使用位操作来管理一个锁变量以控制对某个共享变量的访问，则相对复杂并值得讨论。

.linux-2.6.22.6_vscodeincludeasm-armitops.h

（九）顺序锁—— seqlock

提供对共享资源的快速、免锁访问。

使用场景：受保护的资源——很小、很简单、会频繁的地被使用、写入访问很少发生并且必须快速时，可以使用seqlock。

seqlock会允许读取者对资源的自由访问，到要求读取者检查是否和写入者发生冲突，当这种冲突发生时，就需要重试对资源的访问。

seqlock通常不能用于保护包含有指针的结构数据。

读取访问通过获得一个（无符号的）整数顺序值而进入临界区；在退出时，该顺序值会和当前值比较；如果不相等，则必须重试读取访问。

.linux-2.6.22.6_vscodeincludelinuxseqlock.h

（十）读取-复制-更新（Read-Copy-Updata，RCU）

高级的互斥机制。

很少在驱动程序中使用，但是很知名，因此我们必须有基本的了解。