golang学习笔记---字典的操作和约束

map

  • 类似其它语言中的哈希表或字典,以key-value形式存储数据
  • key必须是支持==或!=比较运算的类型,不可以是函数、map或slice
  • Map通过key查找value比线性搜索快很多
  • Map使用make()创建,支持:=这种简写方式
  • make([keyType]valueType,cap),cap表示容量,可省略
  • 超出容量时会自动扩容,但尽量提供一个合理的初始值
  • 使用len()获取元素个数
  • 键值对不存在时自动添加,使用delete()删除某键值对
  • 使用for range对map和slice进行迭代

字典(map)它能存储的不是单一值的集合,而是键值对的集合。

什么是键值对?它是从英文 key-value pair 直译过来的一个词。顾名思义,一个键值对就代表了一对键和值。注意,一个“键”和一个“值”分别代表了一个从属于某一类型的独立值,把它们两个捆绑在一起就是一个键值对了。

在 Go 语言规范中,应该是为了避免歧义,他们将键值对换了一种称呼,叫做:“键 - 元素对”。我们也沿用这个看起来更加清晰的词来讲解。

Go 语言的字典类型其实是一个哈希表(hash table)的特定实现,在这个实现中,键和元素的最大不同在于,键的类型是受限的,而元素却可以是任意类型的。

哈希表中最重要的一个过程:映射

可以把键理解为元素的一个索引,我们可以在哈希表中通过键查找与它成对的那个元素。键和元素的这种对应关系,在数学里就被称为“映射”,这也是“map”这个词的本意,

哈希表的映射过程就存在于对键 - 元素对的增、删、改、查的操作之中。

package main

import (
	"fmt"
)

func main() {

	aMap := map[string]int{
		"one":   1,
		"two":   2,
		"three": 3,
	}
	k := "two"
	v, ok := aMap[k]
	if ok {
		fmt.Printf("The element of key %q: %d
", k, v)
	} else {
		fmt.Println("Not found!")
	}
}

  

比如,我们要在哈希表中查找与某个键值对应的那个元素值,那么我们需要先把键值作为参数传给这个哈希表。哈希表会先用哈希函数(hash function)把键值转换为哈希值。

哈希值通常是一个无符号的整数。一个哈希表会持有一定数量的桶(bucket),我们也可以叫它哈希桶,这些哈希桶会均匀地储存其所属哈希表收纳的键 - 元素对。

因此,哈希表会先用这个键哈希值的低几位去定位到一个哈希桶,然后再去这个哈希桶中,查找这个键。由于键 - 元素对总是被捆绑在一起存储的,所以一旦找到了键,就一定能找到对应的元素值。随后,哈希表就会把相应的元素值作为结果返回。

映射过程的第一步就是:把键值转换为哈希值。

在 Go 语言的字典中,每一个键值都是由它的哈希值代表的。也就是说,字典不会独立存储任何键的值,但会独立存储它们的哈希值。

Go 语言字典的键类型不可以是函数类型、字典类型和切片类型。

Go 语言规范规定,在键类型的值之间必须可以施加操作符==和!=。换句话说,键类型的值必须要支持判等操作。由于函数类型、字典类型和切片类型的值并不支持判等操作,所以字典的键类型不能是这些类型。

var badMap2 = map[interface{}]int{
  "1":   1,
  []int{2}: 2, // 这里会引发panic。
  3:    3,
}

  

另外,如果键的类型是接口类型的,那么键值的实际类型也不能是上述三种类型,否则在程序运行过程中会引发 panic(即运行时恐慌)。

声明 & 默认值

// 声明
var m map[string]string

map的声明的时候默认值是nil ,此时进行取值,返回的是对应类型的零值(不存在也是返回零值)。

// bool 的零值是false
var m map[int]bool 
a, ok := m[1]
fmt.Println(a, ok) // false  false

// int 的零值是0
var m map[int]int 
a, ok := m[1]
fmt.Println(a, ok) // 0  false

 

初始化

map数据类型初始化:两种方式:map[string]string{}或make(map[string]string)

// 声明之后必须初始化,才能使用
m = make(map[string]int)
m = map[string]int{}

// 声明并初始化 <= 注意这里是 := 不是 =
m := make(map[string]int)
m := map[string]int{1:1}

  

向未初始化的map赋值引起 panic: assign to entry in nil map.

package main

import (
	"fmt"
)

func main() {

	// 声明之后必须初始化,才能使用

	// 声明并初始化 <= 注意这里是 := 不是 =
	var m map[string]int
	m["helo"] = 2
	fmt.Println(m)
}

  

输出:

panic: assignment to entry in nil map

goroutine 1 [running]:

main.main()

D:/GOWORK/src/study/main.go:13 +0x2e

未初始化的map是nil:

未初始化的map是nil,它与一个空map基本等价,只是nil的map不允许往里面添加值。(A nil map is equivalent to an empty map except that no elements may be added)
因此,map是nil时,取值是不会报错的(取不到而已),但增加值会报错。
其实,还有一个区别,delete一个nil map会panic,但是delete 空map是一个空操作(并不会panic)(这个区别在最新的Go tips中已经没有了,即:delete一个nil map也不会panic)

通过fmt打印map时,空map和nil map结果是一样的,都为map[]。所以,这个时候别断定map是空还是nil,而应该通过map == nil来判断。
Request中的Form字段就是如此,在没有直接或间接调用ParseForm()时,Form其实是nil,但是,你如果println出来,却是map[],可能有些困惑。通过跟踪源码可以发现,Form根本没有初始化。而在FormValue()方法中会判断Form是否为nil,然后决定是否调用ParseForm()方法,当然,你也可以手动调用ParseForm()方法。

package main

import (
	"fmt"
	"reflect"
)

func main() {

	var m1 map[string]int
	m1 = make(map[string]int)
	m2 := make(map[string]int)
	fmt.Println(m1, m2)
	m1["chen"] = 88888
	m2["chen"] = 88888
	fmt.Println(m1, m2)
	fmt.Println(reflect.DeepEqual(m1, m2))

}

  输出:

map[] map[]

map[chen:88888] map[chen:88888]

true

package main

import (
	"fmt"
	"reflect"
)

func main() {

	var m1, m2 map[string]int
	m1 = make(map[string]int)
	fmt.Println(m1, m2)
	m1["chen"] = 88888
	m2["chen"] = 88888
	fmt.Println(m1, m2)
	fmt.Println(reflect.DeepEqual(m1, m2))

}

  输出:   ----m2 是nil,增加值会报错。无法向m2中添加数据

map[] map[]

panic: assignment to entry in nil map

 

goroutine 1 [running]:

main.main()

D:/GOWORK/src/study/main.go:14 +0xb1

package main

import (
	"fmt"
)

func main() {

	m := make(map[interface{}]interface{})
	m[1] = 56
	m["str"] = "dfsdf"
	for k, v := range m {
		fmt.Println(k, v)
	}

}

  输出:

1 56

str dfsdf

key与value的限制

key一定要是可比较的类型(可以理解为支持==的操作):

如果是非法的key类型,会报错:invalid map key type xxx

golang为uint32、uint64、string提供了fast access,使用这些类型作为key可以提高map访问速度。[runtime/hashmap_fast.go]

  

value可以是任意类型。

新增 & 删除 & 更新 & 查询

package main

import (
	"fmt"
)

func main() {
	m := make(map[string]string)

	// 新增
	m["name"] = "咖啡色的羊驼"

	// 删除,key不存在则啥也不干
	delete(m, "name")

	// 更新
	m["name"] = "咖啡色的羊驼2"

	// 查询,key不存在返回value类型的零值
	i := m["name"] // 三种查询方式,
	i, ok := m["name"]
	//_, ok := m["name"]

	fmt.Println(i, ok)

}

  输出:

咖啡色的羊驼2 true

如果是非法的key类型,会报错:invalid map key type xxx

几种类型的比较:

arr1 := []int{1,2,3,4}
arr2 := []int{1,2,3,4}

  

切片不可以arr1 == arr2,会报错invalid operation: arr1 == arr2 (slice can only be compared to nil)

切片只可以与nil比较,判断是否为nil,不可以直接用“==”比较,但可以借助于reflect.DeepEqual(arr1, arr2)比较,返回true或false,此外map也可以通过reflect.DeepEqual(m1, m2)比较

package main

import (
	"fmt"
	"reflect"
)

func main() {

	arr1 := []int{1, 2, 3, 4}
	arr2 := []int{1, 2, 3, 4}
	//fmt.Println(arr1 == arr2)  //invalid operation: arr1 == arr2 (slice can only be compared to nil)
	fmt.Println(reflect.DeepEqual(arr1, arr2))

}

  

结构体比较

不同结构的结构体不可以比较,但同一类型的实例值是可以比较的。

两个 struct完全相等, 意味着里面的所有变量的值都完全相等

type Person struct {
      Name, Country string
}
 
hits := make(map[Person]int)

  

判断key是否在map中

if _, ok := map[key]; ok {
    //存在进行相应操作
}

  

遍历

需要强调的是map本身是无序的,在遍历的时候并不会按照你传入的顺序,进行传出。

正常遍历:

package main

import (
	"fmt"
)

func main() {
	m := make(map[string]string)

	// 新增
	m["name"] = "咖啡色的羊驼"

	// 删除,key不存在则啥也不干
	delete(m, "name")

	// 更新
	m["name"] = "咖啡色的羊驼2"
	m["tool"] = "火车"

	// 查询,key不存在返回value类型的零值
	i := m["name"] // 三种查询方式,
	i, ok := m["name"]
	//_, ok := m["name"]

	fmt.Println(i, ok)

	for k, v := range m {
		fmt.Println(k, v)
	}

}

  

有序输出:

package main

import (
	"fmt"
	"sort"
)

func main() {
	m := make(map[string]string)

	// 新增
	m["name"] = "咖啡色的羊驼"

	// 删除,key不存在则啥也不干
	delete(m, "name")

	// 更新
	m["name"] = "咖啡色的羊驼2"
	m["tool"] = "火车"
	m["method"] = "交通工具"

	// 查询,key不存在返回value类型的零值
	i := m["name"] // 三种查询方式,
	i, ok := m["name"]
	//_, ok := m["name"]

	fmt.Println(i, ok)

	for k, v := range m {
		fmt.Println(k, v)
	}

	var keys []string
	// 把key单独抽取出来,放在数组中
	for k, _ := range m {
		keys = append(keys, k)
	}
	// 进行数组的排序
	sort.Strings(keys)
	// 遍历数组就是有序的了
	for _, k := range keys {
		fmt.Println(k, m[k])
	}

}

  

输出:

咖啡色的羊驼2 true

name 咖啡色的羊驼2

tool 火车

method 交通工具

method 交通工具

name 咖啡色的羊驼2

tool 火车

函数传参

Golang中是没有引用传递的,均为值传递。这意味着传递的是数据的拷贝。
那么map本身是引用类型,作为形参或返回参数的时候,传递的是值的拷贝,而值是地址,扩容时也不会改变这个地址。

package main

import (
	"fmt"
)

// 改变map的函数
func changeM(m map[int64]int64) {
	fmt.Printf("m 函数开始时地址是:%p
", m)
	var max = 5
	for i := 0; i < max; i++ {
		m[int64(i)] = 2
	}
	fmt.Printf("m 在函数返回前地址是:%p
", m)
}

func main() {

	var m map[int64]int64
	m = make(map[int64]int64, 1)
	fmt.Printf("m 原始的地址是:%p
", m)
	changeM(m)
	fmt.Printf("m 改变后地址是:%p
", m)
	fmt.Println("m 长度是", len(m))
	fmt.Println("m 参数是", m)

}

  

输出:

m 原始的地址是:0xc0000c0450

m 函数开始时地址是:0xc0000c0450

m 在函数返回前地址是:0xc0000c0450

m 改变后地址是:0xc0000c0450

m 长度是 5

m 参数是 map[0:2 1:2 2:2 3:2 4:2]

map的基础数据结构 & 图

type hmap struct {
    count        int  //元素个数
    flags        uint8   
    B            uint8 //扩容常量
    noverflow    uint16 //溢出 bucket 个数
    hash0        uint32 //hash 种子
    buckets      unsafe.Pointer //bucket 数组指针
    oldbuckets   unsafe.Pointer //扩容时旧的buckets 数组指针
    nevacuate    uintptr  //扩容搬迁进度
    extra        *mapextra //记录溢出相关
}

type bmap struct {
    tophash        [bucketCnt]uint8  
    // Followed by bucketCnt keys 
    //and then bucketan Cnt values  
    // Followed by overflow pointer.
}

  

说明:每个map的地层结构是hmap,是有若干个机构为bmap的bucket组成的数组,每个bucket可以存放若干个元素(通常是8个),那么每个key会根据hash算法归到同一个bucket中,当一个bucket中的元素超过8个的时候,hmap会使用extra中的overflow来扩展存储key。

map的hash值计算

那么具体key是分配到哪个bucket呢?也就是bmap中的tophash是如何计算?

golang为每个类型定义了类型描述器_type,并实现了hashable类型的_type.alg.hash和_type.alg.equal

type typeAlg struct {
    // function for hashing objects of this type
    // (ptr to object, seed) -> hash
    hash func(unsafe.Pointer, uintptr) uintptr
    // function for comparing objects of this type
    // (ptr to object A, ptr to object B) -> ==?
    equal func(unsafe.Pointer, unsafe.Pointer) bool

  

具体实现文件:go/1.10.3/libexec/src/runtime/hashmap.go:

// tophash calculates the tophash value for hash.
func tophash(hash uintptr) uint8 {
	top := uint8(hash >> (sys.PtrSize*8 - 8))
	if top < minTopHash {
		top += minTopHash
	}
	return top
}

  

func main() {
	test := map[int]int {1:1}
	var s sync.RWMutex
	go func() {
		i := 0
		for i < 10000 {
			s.Lock()
			test[1]=1
			s.Unlock()
			i++
		}
	}()

	go func() {
		i := 0
		for i < 10000 {
			s.Lock()
			test[1]=1
			s.Unlock()
			i++
		}
	}()

	time.Sleep(2*time.Second)
	fmt.Println(test)
}

  

sync.Map的原理介绍:sync.Map里头有两个map一个是专门用于读的read map,另一个是才是提供读写的dirty map;优先读read map,若不存在则加锁穿透读dirty map,同时记录一个未从read map读到的计数,当计数到达一定值,就将read map用dirty map进行覆盖。

package main

import (
	"fmt"
	"sync"
	"time"
)

func main() {
	test := sync.Map{}
	test.Store(1, 1)
	go func() {
		i := 0
		for i < 10000 {
			test.Store(1, 3)
			i++
		}
	}()

	go func() {
		i := 0
		for i < 10000 {
			test.Store(1, 2)
			i++
		}
	}()

	time.Sleep(time.Second)
	fmt.Println(test.Load(1))
}

  


map在golang里头是只增不减的一种数组结构,他只会在删除的时候进行打标记说明该内存空间已经empty了,不会回收的。所以要回收map还是需要设为nil

原文地址:https://www.cnblogs.com/saryli/p/15465348.html