golang学习笔记 ---面向并发的内存模型

Go语言是
基于消息并发模型的集大成者，它将基于CSP模型的并发编程内置到了语言中，通
过一个go关键字就可以轻易地启动一个Goroutine，与Erlang不同的是Go语言的
Goroutine之间是共享内存的。

Goroutine和系统线程

Goroutine是Go语言特有的并发体，是一种轻量级的线程，由go关键字启动。在真
实的Go语言的实现中，goroutine和系统线程也不是等价的。尽管两者的区别实际
上只是一个量的区别，但正是这个量变引发了Go语言并发编程质的飞跃。

系统线程

每个系统级线程都会有一个固定大小的栈（一般默认可能是2MB），这个栈
主要用来保存函数递归调用时参数和局部变量。

固定了栈的大小导致了两个问题：
一是对于很多只需要很小的栈空间的线程来说是一个巨大的浪费，二是对于少数需
要巨大栈空间的线程来说又面临栈溢出的风险。针对这两个问题的解决方案是：要
么降低固定的栈大小，提升空间的利用率；要么增大栈的大小以允许更深的函数递
归调用，但这两者是没法同时兼得的。

Goroutine

相反，一个Goroutine会以一个很小的栈启动

（可能是2KB或4KB），当遇到深度递归导致当前栈空间不足时，Goroutine会根据
需要动态地伸缩栈的大小（主流实现中栈的最大值可达到1GB）。

因为启动的代价
很小，所以我们可以轻易地启动成千上万个Goroutine。

Go的运行时还包含了其自己的调度器，这个调度器使用了一些技术手段，可以在n
个操作系统线程上多工调度m个Goroutine。Go调度器的工作和内核的调度是相似
的，但是这个调度器只关注单独的Go程序中的Goroutine。Goroutine采用的是半抢
占式的协作调度，只有在当前Goroutine发生阻塞时才会导致调度；同时发生在用户
态，调度器会根据具体函数只保存必要的寄存器，切换的代价要比系统线程低得
多。运行时有一个 runtime.GOMAXPROCS 变量，用于控制当前运行正常非阻塞
Goroutine的系统线程数目。

在Go语言中启动一个Goroutine不仅和调用函数一样简单，而且Goroutine之间调度
代价也很低，这些因素极大地促进了并发编程的流行和发展。

原子操作

所谓的原子操作就是并发编程中“最小的且不可并行化”的操作。通常，如果多个并
发体对同一个共享资源进行的操作是原子的话，那么同一时刻最多只能有一个并发
体对该资源进行操作。从线程角度看，在当前线程修改共享资源期间，其它的线程
是不能访问该资源的。原子操作对于多线程并发编程模型来说，不会发生有别于单
线程的意外情况，共享资源的完整性可以得到保证。

一般情况下，原子操作都是通过“互斥”访问来保证的，通常由特殊的CPU指令提供
保护。当然，如果仅仅是想模拟下粗粒度的原子操作，我们可以借助
于 sync.Mutex 来实现：

package main

import (
	"fmt"
	"sync"
)

var total struct {
	sync.Mutex
	value int
}

func worker(wg *sync.WaitGroup) {
	defer wg.Done()
	for i := 0; i <= 100; i++ {
		total.Lock()
		total.value += i
		total.Unlock()
	}
}
func main() {
	var wg sync.WaitGroup
	wg.Add(2)
	go worker(&wg)
	go worker(&wg)
	wg.Wait()
	fmt.Println(total.value)
}

在 worker 的循环中，为了保证 total.value += i 的原子性，我们通
过 sync.Mutex 加锁和解锁来保证该语句在同一时刻只被一个线程访问。对于多
线程模型的程序而言，进出临界区前后进行加锁和解锁都是必须的。如果没有锁的
保护， total 的最终值将由于多线程之间的竞争而可能会不正确。

用互斥锁来保护一个数值型的共享资源，麻烦且效率低下。标准库
的 sync/atomic 包对原子操作提供了丰富的支持。我们可以重新实现上面的例
子：

package main

import (
	"fmt"
	"sync"
	"sync/atomic"
)

var total uint64

func worker(wg *sync.WaitGroup) {
	defer wg.Done()
	var i uint64
	for i = 0; i <= 100; i++ {
		atomic.AddUint64(&total, i)
	}
}
func main() {
	var wg sync.WaitGroup
	wg.Add(2)
	go worker(&wg)
	go worker(&wg)
	wg.Wait()
	fmt.Println(total)

}

atomic.AddUint64 函数调用保证了 total 的读取、更新和保存是一个原子操
作，因此在多线程中访问也是安全的。

原子操作配合互斥锁可以实现非常高效的单件模式。互斥锁的代价比普通整数的原
子读写高很多，在性能敏感的地方可以增加一个数字型的标志位，通过原子检测标
志位状态降低互斥锁的使用次数来提高性能。

顺序一致性内存模型

package main

var a string
var done bool

func setup() {
	a = "hello, world"
	done = true
}
func main() {
	go setup()
	for !done {
	}
	print(a)
}

我们创建了 setup 线程，用于对字符串 a 的初始化工作，初始化完成之后设
置 done 标志为 true 。 main 函数所在的主线程中，通过 for !done {} 检
测 done 变为 true 时，认为字符串初始化工作完成，然后进行字符串的打印工
作。

但是Go语言并不保证在 main 函数中观测到的对 done 的写入操作发生在对字符
串 a 的写入的操作之后，因此程序很可能打印一个空字符串。更糟糕的是，因为
两个线程之间没有同步事件， setup 线程对 done 的写入操作甚至无法
被 main 线程看到， main 函数有可能陷入死循环中。

在Go语言中，同一个Goroutine线程内部，顺序一致性内存模型是得到保证的。但
是不同的Goroutine之间，并不满足顺序一致性内存模型，需要通过明确定义的同步
事件来作为同步的参考。如果两个事件不可排序，那么就说这两个事件是并发的。
为了最大化并行，Go语言的编译器和处理器在不影响上述规定的前提下可能会对执
行语句重新排序（CPU也会对一些指令进行乱序执行）。

因此，如果在一个Goroutine中顺序执行 a = 1; b = 2; 两个语句，虽然在当前的
Goroutine中可以认为 a = 1; 语句先于 b = 2; 语句执行，但是在另一个
Goroutine中 b = 2; 语句可能会先于 a = 1; 语句执行，甚至在另一个Goroutine
中无法看到它们的变化（可能始终在寄存器中）。也就是说在另一个Goroutine看
来, a = 1; b = 2; 两个语句的执行顺序是不确定的。如果一个并发程序无法确
定事件的顺序关系，那么程序的运行结果往往会有不确定的结果。比如下面这个程
序

package main

func main() {

    go println("你好, 世界")

根据Go语言规范， main 函数退出时程序结束，不会等待任何后台线程。因为
Goroutine的执行和 main 函数的返回事件是并发的，谁都有可能先发生，所以什
么时候打印，能否打印都是未知的。

用前面的原子操作并不能解决问题，因为我们无法确定两个原子操作之间的顺序。
解决问题的办法就是通过同步原语来给两个事件明确排序：

package main

func main() {
	done := make(chan int)
	go func() {
		println("你好, 世界")
		done <- 1
	}()
	<-done
}

当 <-done 执行时，必然要求 done <- 1 也已经执行。根据同一个Gorouine依然
满足顺序一致性规则，我们可以判断当 done <- 1 执行时， println("你好, 世
界") 语句必然已经执行完成了。因此，现在的程序确保可以正常打印结果。

当然，通过 sync.Mutex 互斥量也是可以实现同步的：

package main

import "sync"

func main() {
	var mu sync.Mutex
	mu.Lock()
	go func() {
		println("你好, 世界")
		mu.Unlock()
	}()
	mu.Lock()
}

可以确定后台线程的 mu.Unlock() 必然在 println("你好, 世界") 完成后发生
（同一个线程满足顺序一致性）， main 函数的第二个 mu.Lock() 必然在后台线
程的 mu.Unlock() 之后发生（ sync.Mutex 保证），此时后台线程的打印工作已
经顺利完成了。