Python集合详解

集合介绍:

集合(set)是一个无序的不重复元素序列。
可以使用大括号 { } 或者 set() 函数创建集合,注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。
创建格式:
parame = {value01,value02,...}
或者
set(value)

在{}内用逗号分隔开多个元素,多个元素满足以下三个条件
# 1. 集合内元素必须为不可变类型
# 2. 集合内元素无序
# 3. 集合内元素没有重复

//集合的用途:

去重和关系运算

关系运算

实例(Python 3.0+)
>>>basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
>>> print(basket)                      # 这里演示的是去重功能
{'orange', 'banana', 'pear', 'apple'}
>>> 'orange' in basket                 # 快速判断元素是否在集合内
True
>>> 'crabgrass' in basket
False

>>> # 下面展示两个集合间的运算.
...
>>> a = set('abracadabra')
>>> b = set('alacazam')
>>> a                                  
{'a', 'r', 'b', 'c', 'd'}
>>> a - b                              # 求差集(只有a中拥有的而b集合没有的元素)
{'r', 'd', 'b'}
>>> a | b                              # 并集(集合a或b中包含的所有元素)
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
>>> a & b                             # a和b的交集(集合a和b中都包含了的元素)
{'a', 'c'}
>>> a ^ b            # 元素在a或b中,但不会同时出现在a和b的集合之中(对称差集)
{'r', 'd', 'b', 'm', 'z', 'l'}

去重:

集合去重复有局限性 

1. 只能针对不可变类型  2. 集合本身是无序的,去重之后无法保留原来的顺序

示例如下
>>> l=['a','b',1,'a','a']
>>> s=set(l)
>>> s # 将列表转成了集合 {'b', 'a', 1}
>>> l_new=list(s) # 再将集合转回列表
>>> l_new ['b', 'a', 1] # 去除了重复,但是打乱了顺序
# 针对不可变类型,并且保证顺序则需要我们自己写代码实现,例如
l=[
  {'name':'lili','age':18,'sex':'male'},
  {'name':'jack','age':73,'sex':'male'},
  {'name':'tom','age':20,'sex':'female'},
  {'name':'lili','age':18,'sex':'male'},
  {'name':'lili','age':18,'sex':'male'},
]

new_l=[]

for dic in l:
  if dic not in new_l:
    new_l.append(dic)
print(new_l)
# 结果:既去除了重复,又保证了顺序,而且是针对不可变类型的去重
[
  {'age': 18, 'sex': 'male', 'name': 'lili'},
  {'age': 73, 'sex': 'male', 'name': 'jack'},
  {'age': 20, 'sex': 'female', 'name': 'tom'}
]

类似列表推导式,同样集合支持集合推导式(Set comprehension):

实例(Python 3.0+)
//代码
a = {x for x in 'abracadabra' if x not in 'abc'}      
print(a)
//执行结果
{'r', 'd'}
//解释
a = {x for x in 'abracadabra' if x not in 'abc'}
从'abracadabra'中用for循环,取出,如果x不在其中则x存到a集合中

将列表转换为集合(但凡能被for循环的遍历的数据类型(强调:遍历出的每一个值都必须为不可变类型)都可以传给set()转换成集合类型)

list1=['1','2','3','3']
b=set(list1)
print(b,type(b))
//执行结果
{'2', '3', '1'} <class 'set'>

集合的基本操作

1:添加元素

语法格式如下:
s.add( x ) #添加一项
将元素 x 添加到集合 s 中,如果元素已存在,则不进行任何操作。

实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> thisset.add("Facebook")
>>> print(thisset)
{'Taobao', 'Facebook', 'Google', 'Runoob'}

还有一个方法,也可以添加元素,且参数可以是列表,元组,字典等,语法格式如下:

s.update( x ) #添加多项

x 可以有多个,用逗号分开。

实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> thisset.update({1,3})
>>> print(thisset)
{1, 3, 'Google', 'Taobao', 'Runoob'}
>>> thisset.update([1,4],[5,6])  
>>> print(thisset)
{1, 3, 4, 5, 6, 'Google', 'Taobao', 'Runoob'}
>>>

2:移除元素

//语法格式如下:

s.remove( x )
将元素 x 从集合 s 中移除,如果元素不存在,则会发生错误。
//实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> thisset.remove("Taobao")
>>> print(thisset)
{'Google', 'Runoob'}
>>> thisset.remove("Facebook") # 不存在会发生错误
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 'Facebook'
>>>
此外还有一个方法也是移除集合中的元素,且如果元素不存在,不会发生错误。格式如下所示:
s.discard( x )
实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> thisset.discard("Facebook") # 不存在不会发生错误
>>> print(thisset)
{'Taobao', 'Google', 'Runoob'}
我们也可以设置随机删除集合中的一个元素,语法格式如下:

s.pop()
脚本模式实例(Python 3.0+)
thisset = set(("Google", "Runoob", "Taobao", "Facebook"))
x = thisset.pop()
print(x)
输出结果:
Runoob
多次执行测试结果都不一样。
然而在交互模式,pop 是删除集合的第一个元素(排序后的集合的第一个元素)。
实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao", "Facebook"))
>>> thisset.pop()
'Facebook'
>>> print(thisset)
{'Google', 'Taobao', 'Runoob'}
>>>

3:计算集合元素个数

语法格式如下:
len(s)
计算集合 s 元素个数。
实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> len(thisset)
3

4:清空集合

语法格式如下:
s.clear()
清空集合 s。
实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> thisset.clear()
>>> print(thisset)
set()

5:判断元素是否在集合中存在

语法格式如下:
x in s
判断元素 x 是否在集合 s 中,存在返回 True,不存在返回 False。
实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> "Runoob" in thisset
True
>>> "Facebook" in thisset
False
>>>

集合内置方法完整列表

add() 为集合添加元素

//描述
add() 方法用于给集合添加元素,如果添加的元素在集合中已存在,则不执行任何操作。
//语法
add()方法语法:
set.add(elmnt)
//参数
elmnt -- 必需,要添加的元素。
//返回值
无。

//实例
以下实例展示了 add() 方法的使用:

//实例 1
fruits = {"apple", "banana", "cherry"}
fruits.add("orange") 
print(fruits)
输出结果为:
{'apple', 'banana', 'orange', 'cherry'}
已存在的元素,则不执行添加操作:
//实例 2
fruits = {"apple", "banana", "cherry"}
fruits.add("apple")
print(fruits)
输出结果为:
{'apple', 'banana', 'cherry'}

clear() 移除集合中的所有元素

//描述
clear() 方法用于移除集合中的所有元素。
//语法
clear()方法语法:
set.clear()
//参数
无。
//返回值
无。

//实例
移除 fruits 集合中的所有元素:

//实例 1
fruits = {"apple", "banana", "cherry"}
fruits.clear()
print(fruits)
输出结果为:
set()

copy() 拷贝一个集合

//描述
copy() 方法用于拷贝一个集合。
//语法
copy() 方法语法:
set.copy()
//参数
无。
//返回值
无。
//实例
拷贝 fruits 集合:

//实例 1
fruits = {"apple", "banana", "cherry"}
x = fruits.copy()
print(x)
输出结果为:
{'cherry', 'banana', 'apple'}

difference() 返回集合间的差集

//描述
difference() 方法用于返回集合的差集,即返回的集合元素包含在第一个集合中,但不包含在第二个集合(方法的参数)中。
//语法
difference() 方法语法:
set.difference(set)
//参数
set -- 必需,用于计算差集的集合
//返回值
返回一个新的集合。

//实例
返回一个集合,元素包含在集合 x ,但不在集合 y :

//实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "microsoft", "apple"} 
z = x.difference(y) 
print(z)
输出结果为:
{'cherry', 'banana'}

difference_update() 移除集合中的元素,该元素在指定的集合也存在。

//描述
difference_update() 方法用于移除两个集合中都存在的元素。
difference_update() 方法与 difference() 方法的区别在于 difference() 方法返回一个移除相同元素的新集合,而 difference_update() 方法是直接在原来的集合中移除元素,没有返回值。

//语法
difference_update() 方法语法:
set.difference_update(set)
//参数
set -- 必需,用于计算差集的集合
//返回值
无。

//实例
移除两个集合都包含的元素:

实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "microsoft", "apple"}
x.difference_update(y) 
print(x)
输出结果为:
{'cherry', 'banana'}

discard() 删除集合中指定的元素

//描述
discard() 方法用于移除指定的集合元素。

该方法不同于 remove() 方法,因为 remove() 方法在移除一个不存在的元素时会发生错误,而 discard() 方法不会。
//语法
discard() 方法语法:
set.discard(value)
//参数
value -- 必需,要移除的元素
//返回值(如果要移除的元素不存在,则返回None)
None。

//实例
移除集合中的元素 banana:

实例 1
fruits = {"apple", "banana", "cherry"}
print(fruits.discard("name"))
输出结果为:
None

intersection() 返回集合的交集

//描述
intersection() 方法用于返回两个或更多集合中都包含的元素,即交集。
//语法
intersection() 方法语法:
set.intersection(set1, set2 ... etc)
//参数
set1 -- 必需,要查找相同元素的集合
set2 -- 可选,其他要查找相同元素的集合,可以多个,多个使用逗号 , 隔开
//返回值
返回一个新的集合。

//实例
返回一个新集合,该集合的元素既包含在集合 x 又包含在集合 y 中:

实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}
z = x.intersection(y) 
print(z)
输出结果为:
{'apple'}

计算多个集合:

//实例 2
x = {"a", "b", "c"}
y = {"c", "d", "e"}
z = {"f", "g", "c"}
result = x.intersection(y, z)
print(result)
输出结果为:
{'c'}

intersection_update() 删除集合中的元素,该元素在指定的集合中不存在。

//描述
intersection_update() 方法用于移除两个或更多集合中都不重叠的元素,即计算交集。
intersection_update() 方法不用于 intersection() 方法,因为 intersection() 方法是返回一个新的集合,而 intersection_update() 方法是在原始的集合上移除不重叠的元素(两个集合间除去不是交集的部分,也就是只留下交集的元素)。
//语法
intersection_update() 方法语法:
set.intersection_update(set1, set2 ... etc)
//参数
set1 -- 必需,要查找相同元素的集合
set2 -- 可选,其他要查找相同元素的集合,可以多个,多个使用逗号 , 隔开
//返回值
无。

//实例
返回一个新集合,该集合的元素既包含在集合 x 又包含在集合 y 中:

//实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}
x.intersection_update(y) 
print(x)
输出结果为:
{'apple'}

计算多个集合的交集:

//实例 2
x = {"a", "b", "c"}
y = {"c", "d", "e"}
z = {"f", "g", "c"}
x.intersection_update(y, z)
print(x)
输出结果为:
{'c'}

isdisjoint() 判断两个集合是否包含相同的元素(是否有交集),如果没有返回 True,否则返回 False。

//描述
isdisjoint() 方法用于判断两个集合是否包含相同的元素,如果没有返回 True,否则返回 False。。
//语法
isdisjoint() 方法语法:
set.isdisjoint(set)
//参数
set -- 必需,要比较的集合
//返回值
返回布尔值,如果不包含返回 True,否则返回 False。
//实例
判断集合 y 中是否有包含 集合 x 的元素:

//实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "facebook"}
z = x.isdisjoint(y) 
print(z)
输出结果为:
True

如果包含返回 False:

//实例 2
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}
z = x.isdisjoint(y) 
print(z)
输出结果为:
False

issubset() 判断指定集合是否为该方法参数集合的子集。

//描述
issubset() 方法用于判断集合的所有元素是否都包含在指定集合中,如果是则返回 True,否则返回 False。
//语法
issubset() 方法语法:
set.issubset(set)
//参数
set -- 必需,要比查找的集合
//返回值
返回布尔值,如果都包含返回 True,否则返回 False。
//实例
判断集合 x 的所有元素是否都包含在集合 y 中:

//实例 1
x = {"a", "b", "c"}
y = {"f", "e", "d", "c", "b", "a"} 
z = x.issubset(y) 
print(z)
输出结果为:
True

如果没有全部包含返回 False:

//实例 2
x = {"a", "b", "c"}
y = {"f", "e", "d", "c", "b"}
z = x.issubset(y) 
print(z)
输出结果为:
False

issuperset() 判断该方法的参数集合是否为指定集合的子集(也就是指定集合是否是方法参数集合的父集)

//描述
issuperset() 方法用于判断指定集合的所有元素是否都包含在原始的集合中,如果是则返回 True,否则返回 False。
//语法
issuperset() 方法语法:
set.issuperset(set)
//参数
set -- 必需,要比查找的集合
//返回值
返回布尔值,如果都包含返回 True,否则返回 False。
//实例
判断集合 y 的所有元素是否都包含在集合 x 中(x是否是y的父集)

//实例 1
x = {"f", "e", "d", "c", "b", "a"}
y = {"a", "b", "c"}
z = x.issuperset(y) 
print(z)
输出结果为:
True

如果没有全部包含返回 False:

//实例 2
x = {"f", "e", "d", "c", "b"}
y = {"a", "b", "c"}
z = x.issuperset(y) 
print(z)
输出结果为:
False

pop() 随机移除元素

//描述
pop() 方法用于随机移除一个元素。
//语法
pop() 方法语法:
set.pop()
//参数

//返回值
返回移除的元素。
//实例
随机移除一个元素:

//实例 1
fruits = {"apple", "banana", "cherry"}
fruits.pop() 
print(fruits)
输出结果为:
{'apple', 'banana'}

输出返回值:

//实例 2
fruits = {"apple", "banana", "cherry"}
x = fruits.pop() 
print(x)
输出结果为:
banana

remove() 移除指定元素

//描述
remove() 方法用于移除集合中的指定元素。
该方法不同于 discard() 方法,因为 remove() 方法在移除一个不存在的元素时会发生错误,而 discard() 方法不会。

//语法
remove() 方法语法:
set.remove(item)
//参数
item -- 要移除的元素
//返回值
返回移除的元素。
//实例
移除元素 banana:

//实例 1
fruits = {"apple", "banana", "cherry"}
fruits.remove("banana") 
print(fruits)
输出结果为:
{'cherry', 'apple'}

symmetric_difference() 返回两个集合中不重复的元素集合。(对称差集)

//描述
symmetric_difference() 方法返回两个集合中不重复的元素集合,即会移除两个集合中都存在的元素。(除去交集的部分)
//语法
symmetric_difference() 方法语法:
set.symmetric_difference(set)
//参数
set -- 集合
//返回值
返回一个新的集合。
//实例
返回两个集合组成的新集合,但会移除两个集合的重复元素:

//实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}
z = x.symmetric_difference(y) 
print(z)
输出结果为:
{'google', 'cherry', 'banana', 'runoob'}

symmetric_difference_update()移除当前集合中在另外一个指定集合相同的元素,并将另外一个指定集合中不同的元素插入到当前集合中。

//描述

symmetric_difference_update() 方法移除当前集合中在另外一个指定集合相同的元素,并将另外一个指定集合中不同的元素插入到当前集合中。

//语法

symmetric_difference_update() 方法语法:

set.symmetric_difference_update(set)

//参数

set -- 要检测的集合

//返回值

无。

//实例

在原始集合 x 中移除与 y 集合中的重复元素,并将不重复的元素插入到集合 x 中:

//实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"} 
x.symmetric_difference_update(y)  
print(x)
输出结果为:
{'google', 'cherry', 'banana', 'runoob'}

union()返回两个集合的并集

//描述

union() 方法返回两个集合的并集,即包含了所有集合的元素,重复的元素只会出现一次。

//语法

union() 方法语法:

set.union(set1, set2...)

//参数

set1 -- 必需,合并的目标集合

set2 -- 可选,其他要合并的集合,可以多个,多个使用逗号 , 隔开。

//返回值

返回一个新集合。

//实例

合并两个集合,重复元素只会出现一次:

//实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"} 
z = x.union(y)  
print(z)
输出结果为:
{'cherry', 'runoob', 'google', 'banana', 'apple'}

合并多个集合:

//实例 2
x = {"a", "b", "c"}
y = {"f", "d", "a"}
z = {"c", "d", "e"}
result = x.union(y, z) 
print(result)
输出结果为:
{'c', 'd', 'f', 'e', 'b', 'a'}

update()给集合添加元素

//描述

update() 方法用于修改当前集合,可以添加新的集合到当前集合中(括号中是集合)

//语法

update() 方法语法:

set.update(set)

//参数

set -- 必需,可以是元素或集合

//返回值

无。

//实例

合并两个集合,重复元素只会出现一次:

//实例 1

x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}
x.update(y) 
print(x)
输出结果为:
{'banana', 'apple', 'google', 'runoob', 'cherry'}
原文地址:https://www.cnblogs.com/baicai37/p/12365614.html