golang学习笔记---字典的操作和约束

map

类似其它语言中的哈希表或字典，以key-value形式存储数据
key必须是支持==或!=比较运算的类型，不可以是函数、map或slice
Map通过key查找value比线性搜索快很多
Map使用make()创建，支持:=这种简写方式
make([keyType]valueType,cap),cap表示容量，可省略
超出容量时会自动扩容，但尽量提供一个合理的初始值
使用len()获取元素个数
键值对不存在时自动添加，使用delete()删除某键值对
使用for range对map和slice进行迭代

字典（map）它能存储的不是单一值的集合，而是键值对的集合。

什么是键值对？它是从英文 key-value pair 直译过来的一个词。顾名思义，一个键值对就代表了一对键和值。注意，一个“键”和一个“值”分别代表了一个从属于某一类型的独立值，把它们两个捆绑在一起就是一个键值对了。

在 Go 语言规范中，应该是为了避免歧义，他们将键值对换了一种称呼，叫做：“键 - 元素对”。我们也沿用这个看起来更加清晰的词来讲解。

Go 语言的字典类型其实是一个哈希表（hash table）的特定实现，在这个实现中，键和元素的最大不同在于，键的类型是受限的，而元素却可以是任意类型的。

哈希表中最重要的一个过程：映射

可以把键理解为元素的一个索引，我们可以在哈希表中通过键查找与它成对的那个元素。键和元素的这种对应关系，在数学里就被称为“映射”，这也是“map”这个词的本意，

哈希表的映射过程就存在于对键 - 元素对的增、删、改、查的操作之中。

package main

import (
	"fmt"
)

func main() {

	aMap := map[string]int{
		"one":   1,
		"two":   2,
		"three": 3,
	}
	k := "two"
	v, ok := aMap[k]
	if ok {
		fmt.Printf("The element of key %q: %d
", k, v)
	} else {
		fmt.Println("Not found!")
	}
}

比如，我们要在哈希表中查找与某个键值对应的那个元素值，那么我们需要先把键值作为参数传给这个哈希表。哈希表会先用哈希函数（hash function）把键值转换为哈希值。

哈希值通常是一个无符号的整数。一个哈希表会持有一定数量的桶（bucket），我们也可以叫它哈希桶，这些哈希桶会均匀地储存其所属哈希表收纳的键 - 元素对。

因此，哈希表会先用这个键哈希值的低几位去定位到一个哈希桶，然后再去这个哈希桶中，查找这个键。由于键 - 元素对总是被捆绑在一起存储的，所以一旦找到了键，就一定能找到对应的元素值。随后，哈希表就会把相应的元素值作为结果返回。

映射过程的第一步就是：把键值转换为哈希值。

在 Go 语言的字典中，每一个键值都是由它的哈希值代表的。也就是说，字典不会独立存储任何键的值，但会独立存储它们的哈希值。

Go 语言字典的键类型不可以是函数类型、字典类型和切片类型。

Go 语言规范规定，在键类型的值之间必须可以施加操作符==和!=。换句话说，键类型的值必须要支持判等操作。由于函数类型、字典类型和切片类型的值并不支持判等操作，所以字典的键类型不能是这些类型。

var badMap2 = map[interface{}]int{
  "1":   1,
  []int{2}: 2, // 这里会引发panic。
  3:    3,
}

另外，如果键的类型是接口类型的，那么键值的实际类型也不能是上述三种类型，否则在程序运行过程中会引发 panic（即运行时恐慌）。

声明 & 默认值

// 声明
var m map[string]string

map的声明的时候默认值是nil ，此时进行取值，返回的是对应类型的零值（不存在也是返回零值）。

// bool 的零值是false
var m map[int]bool 
a, ok := m[1]
fmt.Println(a, ok) // false  false

// int 的零值是0
var m map[int]int 
a, ok := m[1]
fmt.Println(a, ok) // 0  false

初始化

map数据类型初始化：两种方式：map[string]string{}或make(map[string]string)

// 声明之后必须初始化，才能使用
m = make(map[string]int)
m = map[string]int{}

// 声明并初始化 <= 注意这里是 := 不是 =
m := make(map[string]int)
m := map[string]int{1:1}

向未初始化的map赋值引起 panic: assign to entry in nil map.

package main

import (
	"fmt"
)

func main() {

	// 声明之后必须初始化，才能使用

	// 声明并初始化 <= 注意这里是 := 不是 =
	var m map[string]int
	m["helo"] = 2
	fmt.Println(m)
}

输出：

panic: assignment to entry in nil map

goroutine 1 [running]:

main.main()

D:/GOWORK/src/study/main.go:13 +0x2e

未初始化的map是nil：

未初始化的map是nil，它与一个空map基本等价，只是nil的map不允许往里面添加值。（A nil map is equivalent to an empty map except that no elements may be added）
因此，map是nil时，取值是不会报错的（取不到而已），但增加值会报错。
其实，还有一个区别，delete一个nil map会panic，但是delete 空map是一个空操作（并不会panic）（这个区别在最新的Go tips中已经没有了，即：delete一个nil map也不会panic）

通过fmt打印map时，空map和nil map结果是一样的，都为map[]。所以，这个时候别断定map是空还是nil，而应该通过map == nil来判断。
Request中的Form字段就是如此，在没有直接或间接调用ParseForm()时，Form其实是nil，但是，你如果println出来，却是map[]，可能有些困惑。通过跟踪源码可以发现，Form根本没有初始化。而在FormValue()方法中会判断Form是否为nil，然后决定是否调用ParseForm()方法，当然，你也可以手动调用ParseForm()方法。

package main

import (
	"fmt"
	"reflect"
)

func main() {

	var m1 map[string]int
	m1 = make(map[string]int)
	m2 := make(map[string]int)
	fmt.Println(m1, m2)
	m1["chen"] = 88888
	m2["chen"] = 88888
	fmt.Println(m1, m2)
	fmt.Println(reflect.DeepEqual(m1, m2))

}

　　输出：

map[] map[]

map[chen:88888] map[chen:88888]

true

package main

import (
	"fmt"
	"reflect"
)

func main() {

	var m1, m2 map[string]int
	m1 = make(map[string]int)
	fmt.Println(m1, m2)
	m1["chen"] = 88888
	m2["chen"] = 88888
	fmt.Println(m1, m2)
	fmt.Println(reflect.DeepEqual(m1, m2))

}

　　输出： ----m2 是nil，增加值会报错。无法向m2中添加数据

map[] map[]

panic: assignment to entry in nil map

goroutine 1 [running]:

main.main()

D:/GOWORK/src/study/main.go:14 +0xb1

package main

import (
	"fmt"
)

func main() {

	m := make(map[interface{}]interface{})
	m[1] = 56
	m["str"] = "dfsdf"
	for k, v := range m {
		fmt.Println(k, v)
	}

}

　　输出：

1 56

str dfsdf

key与value的限制

key一定要是可比较的类型（可以理解为支持==的操作）：

如果是非法的key类型，会报错：invalid map key type xxx

golang为uint32、uint64、string提供了fast access，使用这些类型作为key可以提高map访问速度。[runtime/hashmap_fast.go]

value可以是任意类型。

新增 & 删除 & 更新 & 查询

package main

import (
	"fmt"
)

func main() {
	m := make(map[string]string)

	// 新增
	m["name"] = "咖啡色的羊驼"

	// 删除，key不存在则啥也不干
	delete(m, "name")

	// 更新
	m["name"] = "咖啡色的羊驼2"

	// 查询，key不存在返回value类型的零值
	i := m["name"] // 三种查询方式，
	i, ok := m["name"]
	//_, ok := m["name"]

	fmt.Println(i, ok)

}

　　输出：

咖啡色的羊驼2 true

如果是非法的key类型，会报错：invalid map key type xxx

几种类型的比较：

arr1 := []int{1,2,3,4}
arr2 := []int{1,2,3,4}

切片不可以arr1 == arr2,会报错invalid operation: arr1 == arr2 (slice can only be compared to nil)

切片只可以与nil比较，判断是否为nil,不可以直接用“==”比较，但可以借助于reflect.DeepEqual(arr1, arr2)比较，返回true或false,此外map也可以通过reflect.DeepEqual(m1, m2)比较

package main

import (
	"fmt"
	"reflect"
)

func main() {

	arr1 := []int{1, 2, 3, 4}
	arr2 := []int{1, 2, 3, 4}
	//fmt.Println(arr1 == arr2)  //invalid operation: arr1 == arr2 (slice can only be compared to nil)
	fmt.Println(reflect.DeepEqual(arr1, arr2))

}

结构体比较

不同结构的结构体不可以比较，但同一类型的实例值是可以比较的。

两个 struct完全相等，意味着里面的所有变量的值都完全相等

type Person struct {
      Name, Country string
}
 
hits := make(map[Person]int)

判断key是否在map中

if _, ok := map[key]; ok {
    //存在进行相应操作
}

遍历

需要强调的是map本身是无序的，在遍历的时候并不会按照你传入的顺序，进行传出。

正常遍历：

package main

import (
	"fmt"
)

func main() {
	m := make(map[string]string)

	// 新增
	m["name"] = "咖啡色的羊驼"

	// 删除，key不存在则啥也不干
	delete(m, "name")

	// 更新
	m["name"] = "咖啡色的羊驼2"
	m["tool"] = "火车"

	// 查询，key不存在返回value类型的零值
	i := m["name"] // 三种查询方式，
	i, ok := m["name"]
	//_, ok := m["name"]

	fmt.Println(i, ok)

	for k, v := range m {
		fmt.Println(k, v)
	}

}

有序输出：

package main

import (
	"fmt"
	"sort"
)

func main() {
	m := make(map[string]string)

	// 新增
	m["name"] = "咖啡色的羊驼"

	// 删除，key不存在则啥也不干
	delete(m, "name")

	// 更新
	m["name"] = "咖啡色的羊驼2"
	m["tool"] = "火车"
	m["method"] = "交通工具"

	// 查询，key不存在返回value类型的零值
	i := m["name"] // 三种查询方式，
	i, ok := m["name"]
	//_, ok := m["name"]

	fmt.Println(i, ok)

	for k, v := range m {
		fmt.Println(k, v)
	}

	var keys []string
	// 把key单独抽取出来，放在数组中
	for k, _ := range m {
		keys = append(keys, k)
	}
	// 进行数组的排序
	sort.Strings(keys)
	// 遍历数组就是有序的了
	for _, k := range keys {
		fmt.Println(k, m[k])
	}

}

输出：

咖啡色的羊驼2 true

name 咖啡色的羊驼2

tool 火车

method 交通工具

name 咖啡色的羊驼2

tool 火车

函数传参

Golang中是没有引用传递的，均为值传递。这意味着传递的是数据的拷贝。
那么map本身是引用类型，作为形参或返回参数的时候，传递的是值的拷贝，而值是地址，扩容时也不会改变这个地址。

package main

import (
	"fmt"
)

// 改变map的函数
func changeM(m map[int64]int64) {
	fmt.Printf("m 函数开始时地址是：%p
", m)
	var max = 5
	for i := 0; i < max; i++ {
		m[int64(i)] = 2
	}
	fmt.Printf("m 在函数返回前地址是：%p
", m)
}

func main() {

	var m map[int64]int64
	m = make(map[int64]int64, 1)
	fmt.Printf("m 原始的地址是：%p
", m)
	changeM(m)
	fmt.Printf("m 改变后地址是：%p
", m)
	fmt.Println("m 长度是", len(m))
	fmt.Println("m 参数是", m)

}

输出：

m 原始的地址是：0xc0000c0450

m 函数开始时地址是：0xc0000c0450

m 在函数返回前地址是：0xc0000c0450

m 改变后地址是：0xc0000c0450

m 长度是 5

m 参数是 map[0:2 1:2 2:2 3:2 4:2]

map的基础数据结构 & 图

type hmap struct {
    count        int  //元素个数
    flags        uint8   
    B            uint8 //扩容常量
    noverflow    uint16 //溢出 bucket 个数
    hash0        uint32 //hash 种子
    buckets      unsafe.Pointer //bucket 数组指针
    oldbuckets   unsafe.Pointer //扩容时旧的buckets 数组指针
    nevacuate    uintptr  //扩容搬迁进度
    extra        *mapextra //记录溢出相关
}

type bmap struct {
    tophash        [bucketCnt]uint8  
    // Followed by bucketCnt keys 
    //and then bucketan Cnt values  
    // Followed by overflow pointer.
}

说明：每个map的地层结构是hmap，是有若干个机构为bmap的bucket组成的数组，每个bucket可以存放若干个元素(通常是8个)，那么每个key会根据hash算法归到同一个bucket中，当一个bucket中的元素超过8个的时候，hmap会使用extra中的overflow来扩展存储key。

map的hash值计算

那么具体key是分配到哪个bucket呢？也就是bmap中的tophash是如何计算？

golang为每个类型定义了类型描述器_type，并实现了hashable类型的_type.alg.hash和_type.alg.equal

type typeAlg struct {
    // function for hashing objects of this type
    // (ptr to object, seed) -> hash
    hash func(unsafe.Pointer, uintptr) uintptr
    // function for comparing objects of this type
    // (ptr to object A, ptr to object B) -> ==?
    equal func(unsafe.Pointer, unsafe.Pointer) bool

具体实现文件：go/1.10.3/libexec/src/runtime/hashmap.go:

// tophash calculates the tophash value for hash.
func tophash(hash uintptr) uint8 {
	top := uint8(hash >> (sys.PtrSize*8 - 8))
	if top < minTopHash {
		top += minTopHash
	}
	return top
}

func main() {
	test := map[int]int {1:1}
	var s sync.RWMutex
	go func() {
		i := 0
		for i < 10000 {
			s.Lock()
			test[1]=1
			s.Unlock()
			i++
		}
	}()

	go func() {
		i := 0
		for i < 10000 {
			s.Lock()
			test[1]=1
			s.Unlock()
			i++
		}
	}()

	time.Sleep(2*time.Second)
	fmt.Println(test)
}

sync.Map的原理介绍：sync.Map里头有两个map一个是专门用于读的read map，另一个是才是提供读写的dirty map；优先读read map，若不存在则加锁穿透读dirty map，同时记录一个未从read map读到的计数，当计数到达一定值，就将read map用dirty map进行覆盖。

package main

import (
	"fmt"
	"sync"
	"time"
)

func main() {
	test := sync.Map{}
	test.Store(1, 1)
	go func() {
		i := 0
		for i < 10000 {
			test.Store(1, 3)
			i++
		}
	}()

	go func() {
		i := 0
		for i < 10000 {
			test.Store(1, 2)
			i++
		}
	}()

	time.Sleep(time.Second)
	fmt.Println(test.Load(1))
}

map在golang里头是只增不减的一种数组结构，他只会在删除的时候进行打标记说明该内存空间已经empty了，不会回收的。所以要回收map还是需要设为nil