collections模块

一. tuple功能
特点:不可变,可迭代,可拆包,但tuple不可变性不是绝对的
其实只要类里包含__iter__或者__getitem__任一个魔法函数都是可迭代的
 
1. 拆包
1.1 基本用法
name = ("jack", "hong")
# 按位置赋值给变量
name1, name2 = name
print(name1, name2)
输出
jack, hong
 
1.2 使用星号代替不想取的元素
name = ("jack", "hong", "tiger")
# 只想取第一个元素
name3, *other = name
print(name3, other)
输出结果,剩余的元素放到了一个列表中
jack ['hong', 'tiger']
 
 
 
2. 当元组元素中嵌套列表元素时,其实也是可以改变的。这种写法不推荐
name_tuple = ("jack", [12, 13])
name_tuple[1].append(14)
print(name_tuple)
输出为
('jack', [12, 13, 14])
 
 
 
3. tuple比list好的地方
不可变属性可提高编译速度,线程安全,可作为字典的键(重要)
name_tuple = ("jack", "hong")
 
dict = {}
dict[name_tuple] = "people's name"
print(dict)
输出结果
{('jack', 'hong'): "people's name"}
 
需要注意的是列表也可拆包
name_list = ["jack", "hong"]
name1, *other = name_list
print(name1, other)
输出结果
jack ['hong']
 
 
 
 
 
二. namedtuple功能详解
 
1. 把元组像类一样使用,namedtuple可生成一个类
from collections import namedtuple
 
# 第一个参数名是类名, 后面列表中的元素是类中的属性
User = namedtuple("User", ["name", "age", "height"])
user = User(name="hong", age=21, height=177)
print(user.age, user.height, user.name)
输出结果
21 177 hong
 
相比字典的好处:
1)namedtuple是tuple的一个子类
2)相比一般的类,它更省空间,没有普通类中内置的很多函数和变量
 
2. 函数中的魔法参数
def ask(*args, **kwargs):
    pass
 
ask("hong", 22)
#ask(name="hong", age=22)
当调用函数不带参数名时, 调试结果如下
带参数名时
 
 
3. 上面代码可改写为如下
1)数据不带参数名
from collections import namedtuple
 
User = namedtuple("User", ["name", "age", "height"])
data = ("jack", 28, 188)
user = User(*data)
print(user.name)
2)把数据改为带参数名,并且在类中添加一个edu属性
from collections import namedtuple
 
User = namedtuple("User", ["name", "age", "height", "edu"])
data1 = {
    "name": "jack",
    "age": 27,
    "height": 177
}
user = User(**data1, edu="master")
user = User("jack", 28, 199, "master")
print(user.name)
 
 
4. namedtuple中的内部函数_make,可不用在参数前加星号,参数为可迭代对象
不带参数名时
from collections import namedtuple
 
User = namedtuple("User", ["name", "age", "height"])
data = ("jack", 28, 188)
user = User._make(data)
print(user.name)
 
带参数名时。不太懂,先不管这个了
from collections import namedtuple
 
User = namedtuple("User", ["name", "age", "height"])
data1 = {
    "name": "jack",
    "age": 27,
    "height": 177
}
user = User._make(data1)
user = User("jack", 28, 199)
print(user.name)
注意此时必须有2次实例化
 
 
5. 内部函数之_asdict(),可把元组转变为排序字典
user_info_dict = user._asdict()
 
 
 
 
 
 
二. defaultdict详解, c写的
 
需求:统计列表中各元素出现的次数
 
1. 普通方法如下:
num_dict = {}
nums = ["tiger", "monkey", "tiger", "chicken", "monkey", "tiger", "sheep"]
for num in nums:
    if num not in num_dict:
        num_dict[num] = 1
    else:
        num_dict[num] += 1
print(num_dict)
输出如下
{'chicken': 1, 'tiger': 3, 'monkey': 2, 'sheep': 1}
 
 
2. 使用dict中的setdefault()简化代码
num_dict = {}
nums = ["tiger", "monkey", "tiger", "chicken", "monkey", "tiger", "sheep"]
for num in nums:
    num_dict.setdefault(num, 0)
    num_dict[num] += 1
print(num_dict)
 
 
3. 使用defaultdict
3.1首先看一个defaultdict的简单例子
from collections import defaultdict
default_dict = defaultdict(list)
a = default_dict["hong"]
print(a)
输出如下
[]
说明:
defaultdict是dict的一个子类,它的参数为可调用的对象名字,比如list,int,也可以是函数名等。
上例中键名不存在,且指明为list,则返回一个空list;
如果把list修改为int,则输出结果为0
 
3.2 使用defaultdict简化需求代码,不需要设置默认值
from collections import defaultdict
 
default_dict = defaultdict(int)
nums = ["tiger", "monkey", "tiger", "chicken", "monkey", "tiger", "sheep"]
for num in nums:
    default_dict[num] += 1
 
print(default_dict)
print(default_dict.get("tiger"))
输出结果如下
defaultdict(<class 'int'>, {'chicken': 1, 'sheep': 1, 'monkey': 2, 'tiger': 3})
3
 
3.3 如果是一个嵌套的dict,不能简单的照上面的样式使用defaultdict,可以把这个嵌套的dict放到一个函数中,比如想初始化一个学生的姓名为空,年龄为0
from collections import defaultdict
 
def gen_default():
    return {
        "name": "",
        "age": 0
    }
default_dict = defaultdict(gen_default)
text = default_dict["student1"]
 
print(text)
输出结果如下
{'age': 0, 'name': ''}
 
 
 
 
 
三. deque:双端队列,参数为可迭代对象
 
用法和list很相似,不过增加了一些功能,具体看源代码吧
deque是线程安全的,而list不是
 
例子1
from collections import deque
 
deque1 = deque([12, 44, 28])
print(deque1)
print(deque1[0])
输出结果如下
deque([12, 44, 28])
12
 
说明:
list和deque一般用来保存相同的数据类型
 
 
 
 
 
四. Counter,用来统计可迭代对象中的元素个数
 
Counter是dict的一个子类,参数也是需要可迭代的对象,比如列表,元组,字符串
 
1. 基本使用方法
from collections import Counter
 
users = ["jack", "hong", "jack"]
user_counter = Counter(users)
print(user_counter)
print(user_counter.get("jack"))
输出结果如下
Counter({'jack': 2, 'hong': 1})
2
 
 
2.1 它里面的update()函数可以用来做合并处理
from collections import Counter
 
letter_counter = Counter("aabb")
print(letter_counter)
 
letter_counter.update("abc")
print(letter_counter)
输出结果如下
Counter({'a': 2, 'b': 2})
Counter({'a': 3, 'b': 3, 'c': 1})
 
2.2 update里面的参数也可以是一个Counter变量
from collections import Counter
 
letter_counter = Counter("aabb")
print(letter_counter)
 
x = Counter("abc")
letter_counter.update(x)
print(letter_counter)
输出结果和上面一样
 
 
3. most_common()函数可统计出现次数最多的前N个元素
from collections import Counter
 
letter_counter = Counter("aaabbc")
top2 = letter_counter.most_common(2)
print(top2)
输出结果如下
[('a', 3), ('b', 2)]
注意返回结果类型是列表
 
 
 
 
 
五. OrderedDict,继承dict,它的有序性是按照添加的字典元素顺序输出
 
python3中dict其实也是按照添加元素的顺序输出,但是python2中是无序的
 
1. 基本用法
from collections import OrderedDict
 
user_dict = OrderedDict()
user_dict["c"] = "jack1"
user_dict["a"] = "jack2"
user_dict["b"] = "jack3"
print(user_dict)
输出结果如下
OrderedDict([('c', 'jack1'), ('a', 'jack2'), ('b', 'jack3')])
 
 
2. popitem(),把字典中最后一个键值对弹出来
from collections import OrderedDict
 
user_dict = OrderedDict()
user_dict["c"] = "jack1"
user_dict["a"] = "jack2"
user_dict["b"] = "jack3"
print(user_dict)
 
user_dict.popitem()
print(user_dict)
输出结果如下
OrderedDict([('c', 'jack1'), ('a', 'jack2'), ('b', 'jack3')])
OrderedDict([('c', 'jack1'), ('a', 'jack2')])
 
说明:
pop()方法也可弹出键值对,它需要指明要弹出键值对的键名,例如user_dict.pop("a")
 
 
3. move_to_end(),将某个键值对移到最后,需要指明键名
from collections import OrderedDict
 
user_dict = OrderedDict()
user_dict["c"] = "jack1"
user_dict["a"] = "jack2"
user_dict["b"] = "jack3"
print(user_dict)
 
user_dict.move_to_end("a")
print(user_dict)
输出结果如下
OrderedDict([('c', 'jack1'), ('a', 'jack2'), ('b', 'jack3')])
OrderedDict([('c', 'jack1'), ('b', 'jack3'), ('a', 'jack2')])
 
 
 
 
 
六. ChainMap, 可将多个字典链接起来进行for循环,遍历取到键和值。
 
1. 基本用法
from collections import ChainMap
 
dict1 = {"a": "jack1", "b": "jack2"}
dict2 = {"c": "jack3", "d": "jack4"}
 
newdict = ChainMap(dict1, dict2)
for key, value in newdict.items():
    print(key, value)
输出结果如下
a jack1
b jack2
d jack4
c jack3
 
注意:如果dict2中有和dict1相同的键名,那么只会遍历出dict1中的键值对,如下
from collections import ChainMap
 
dict1 = {"a": "jack1", "b": "jack2"}
dict2 = {"a": "jack3", "d": "jack4"}
 
newdict = ChainMap(dict1, dict2)
print(newdict)
for key, value in newdict.items():
    print(key, value)
输出结果如下
ChainMap({'a': 'jack1', 'b': 'jack2'}, {'a': 'jack3', 'd': 'jack4'})
a jack1
b jack2
d jack4
 
 
2. ChainMap中的new_child函数可动态的添加新的链接字典
from collections import ChainMap
 
dict1 = {"a": "jack1", "b": "jack2"}
dict2 = {"c": "jack3", "d": "jack4"}
 
newdict1 = ChainMap(dict1, dict2)
 
dict3 = {"e": "jack5"}
newdict2 = newdict1.new_child(dict3)
print(newdict2)
for key, value in newdict2.items():
    print(key, value)
输出结果如下
ChainMap({'e': 'jack5'}, {'a': 'jack1', 'b': 'jack2'}, {'c': 'jack3', 'd': 'jack4'})
a jack1
e jack5
c jack3
b jack2
d jack4
 
 
3. maps属性可把链接起来的字典变为list类型,maps不是拷贝,只相当于指向
from collections import ChainMap
 
dict1 = {"a": "jack1", "b": "jack2"}
dict2 = {"c": "jack3"}
 
newdict = ChainMap(dict1, dict2)
print(newdict)
print(newdict.maps)
 
# 修改后会影响原数据
newdict.maps[0]["a"] = "hong"
for key, value in newdict.items():
    print(key, value)
输出结果如下
ChainMap({'b': 'jack2', 'a': 'jack1'}, {'c': 'jack3'})
[{'b': 'jack2', 'a': 'jack1'}, {'c': 'jack3'}]
b jack2
a hong
c jack3
 
 
原文地址:https://www.cnblogs.com/regit/p/9881178.html