Python集合详解

集合介绍：

集合（set）是一个无序的不重复元素序列。
可以使用大括号 { } 或者 set() 函数创建集合，注意：创建一个空集合必须用 set() 而不是 { }，因为 { } 是用来创建一个空字典。
创建格式：
parame = {value01,value02,...}
或者
set(value)

在{}内用逗号分隔开多个元素，多个元素满足以下三个条件
# 1. 集合内元素必须为不可变类型
# 2. 集合内元素无序
# 3. 集合内元素没有重复

//集合的用途：

去重和关系运算

关系运算

实例(Python 3.0+)
>>>basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
>>> print(basket)                      # 这里演示的是去重功能
{'orange', 'banana', 'pear', 'apple'}
>>> 'orange' in basket                 # 快速判断元素是否在集合内
True
>>> 'crabgrass' in basket
False

>>> # 下面展示两个集合间的运算.
...
>>> a = set('abracadabra')
>>> b = set('alacazam')
>>> a                                  
{'a', 'r', 'b', 'c', 'd'}
>>> a - b                              # 求差集（只有a中拥有的而b集合没有的元素）
{'r', 'd', 'b'}
>>> a | b                              # 并集（集合a或b中包含的所有元素）
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
>>> a & b                             # a和b的交集（集合a和b中都包含了的元素）
{'a', 'c'}
>>> a ^ b            # 元素在a或b中，但不会同时出现在a和b的集合之中（对称差集）
{'r', 'd', 'b', 'm', 'z', 'l'}

去重：

集合去重复有局限性

1. 只能针对不可变类型 2. 集合本身是无序的，去重之后无法保留原来的顺序

示例如下
>>> l=['a','b',1,'a','a']
>>> s=set(l)
>>> s # 将列表转成了集合 {'b', 'a', 1}
>>> l_new=list(s) # 再将集合转回列表
>>> l_new ['b', 'a', 1] # 去除了重复，但是打乱了顺序
# 针对不可变类型，并且保证顺序则需要我们自己写代码实现，例如
l=[
　　{'name':'lili','age':18,'sex':'male'},
　　{'name':'jack','age':73,'sex':'male'},
　　{'name':'tom','age':20,'sex':'female'},
　　{'name':'lili','age':18,'sex':'male'},
　　{'name':'lili','age':18,'sex':'male'},
]

new_l=[]

for dic in l:
　　if dic not in new_l:
　　　　new_l.append(dic)
print(new_l)
# 结果：既去除了重复，又保证了顺序，而且是针对不可变类型的去重
[
　　{'age': 18, 'sex': 'male', 'name': 'lili'},
　　{'age': 73, 'sex': 'male', 'name': 'jack'},
　　{'age': 20, 'sex': 'female', 'name': 'tom'}
]

类似列表推导式，同样集合支持集合推导式(Set comprehension):

实例(Python 3.0+)
//代码
a = {x for x in 'abracadabra' if x not in 'abc'}      
print(a)
//执行结果
{'r', 'd'}
//解释
a = {x for x in 'abracadabra' if x not in 'abc'}
从'abracadabra'中用for循环，取出，如果x不在其中则x存到a集合中

将列表转换为集合（但凡能被for循环的遍历的数据类型（强调：遍历出的每一个值都必须为不可变类型）都可以传给set()转换成集合类型）

list1=['1','2','3','3']
b=set(list1)
print(b,type(b))
//执行结果
{'2', '3', '1'} <class 'set'>

集合的基本操作

1：添加元素

语法格式如下：
s.add( x ) #添加一项
将元素 x 添加到集合 s 中，如果元素已存在，则不进行任何操作。

实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> thisset.add("Facebook")
>>> print(thisset)
{'Taobao', 'Facebook', 'Google', 'Runoob'}

还有一个方法，也可以添加元素，且参数可以是列表，元组，字典等，语法格式如下：

s.update( x ) #添加多项

x 可以有多个，用逗号分开。

实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> thisset.update({1,3})
>>> print(thisset)
{1, 3, 'Google', 'Taobao', 'Runoob'}
>>> thisset.update([1,4],[5,6])  
>>> print(thisset)
{1, 3, 4, 5, 6, 'Google', 'Taobao', 'Runoob'}
>>>

2：移除元素

//语法格式如下：

s.remove( x )
将元素 x 从集合 s 中移除，如果元素不存在，则会发生错误。
//实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> thisset.remove("Taobao")
>>> print(thisset)
{'Google', 'Runoob'}
>>> thisset.remove("Facebook") # 不存在会发生错误
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 'Facebook'
>>>
此外还有一个方法也是移除集合中的元素，且如果元素不存在，不会发生错误。格式如下所示：
s.discard( x )
实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> thisset.discard("Facebook") # 不存在不会发生错误
>>> print(thisset)
{'Taobao', 'Google', 'Runoob'}
我们也可以设置随机删除集合中的一个元素，语法格式如下：

s.pop()
脚本模式实例(Python 3.0+)
thisset = set(("Google", "Runoob", "Taobao", "Facebook"))
x = thisset.pop()
print(x)
输出结果：
Runoob
多次执行测试结果都不一样。
然而在交互模式，pop 是删除集合的第一个元素（排序后的集合的第一个元素）。
实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao", "Facebook"))
>>> thisset.pop()
'Facebook'
>>> print(thisset)
{'Google', 'Taobao', 'Runoob'}
>>>

3：计算集合元素个数

语法格式如下：
len(s)
计算集合 s 元素个数。
实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> len(thisset)
3

4：清空集合

语法格式如下：
s.clear()
清空集合 s。
实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> thisset.clear()
>>> print(thisset)
set()

5：判断元素是否在集合中存在

语法格式如下：
x in s
判断元素 x 是否在集合 s 中，存在返回 True，不存在返回 False。
实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> "Runoob" in thisset
True
>>> "Facebook" in thisset
False
>>>

集合内置方法完整列表

add() 为集合添加元素

//描述
add() 方法用于给集合添加元素，如果添加的元素在集合中已存在，则不执行任何操作。
//语法
add()方法语法：
set.add(elmnt)
//参数
elmnt -- 必需，要添加的元素。
//返回值
无。

//实例
以下实例展示了 add() 方法的使用：

//实例 1
fruits = {"apple", "banana", "cherry"}
fruits.add("orange") 
print(fruits)
输出结果为：
{'apple', 'banana', 'orange', 'cherry'}
已存在的元素，则不执行添加操作：
//实例 2
fruits = {"apple", "banana", "cherry"}
fruits.add("apple")
print(fruits)
输出结果为：
{'apple', 'banana', 'cherry'}

clear() 移除集合中的所有元素

//描述
clear() 方法用于移除集合中的所有元素。
//语法
clear()方法语法：
set.clear()
//参数
无。
//返回值
无。

//实例
移除 fruits 集合中的所有元素：

//实例 1
fruits = {"apple", "banana", "cherry"}
fruits.clear()
print(fruits)
输出结果为：
set()

copy() 拷贝一个集合

//描述
copy() 方法用于拷贝一个集合。
//语法
copy() 方法语法：
set.copy()
//参数
无。
//返回值
无。
//实例
拷贝 fruits 集合：

//实例 1
fruits = {"apple", "banana", "cherry"}
x = fruits.copy()
print(x)
输出结果为：
{'cherry', 'banana', 'apple'}

difference() 返回集合间的差集

//描述
difference() 方法用于返回集合的差集，即返回的集合元素包含在第一个集合中，但不包含在第二个集合(方法的参数)中。
//语法
difference() 方法语法：
set.difference(set)
//参数
set -- 必需，用于计算差集的集合
//返回值
返回一个新的集合。

//实例
返回一个集合，元素包含在集合 x ，但不在集合 y ：

//实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "microsoft", "apple"} 
z = x.difference(y) 
print(z)
输出结果为：
{'cherry', 'banana'}

difference_update() 移除集合中的元素，该元素在指定的集合也存在。

//描述
difference_update() 方法用于移除两个集合中都存在的元素。
difference_update() 方法与 difference() 方法的区别在于 difference() 方法返回一个移除相同元素的新集合，而 difference_update() 方法是直接在原来的集合中移除元素，没有返回值。

//语法
difference_update() 方法语法：
set.difference_update(set)
//参数
set -- 必需，用于计算差集的集合
//返回值
无。

//实例
移除两个集合都包含的元素：

实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "microsoft", "apple"}
x.difference_update(y) 
print(x)
输出结果为：
{'cherry', 'banana'}

discard() 删除集合中指定的元素

//描述
discard() 方法用于移除指定的集合元素。

该方法不同于 remove() 方法，因为 remove() 方法在移除一个不存在的元素时会发生错误，而 discard() 方法不会。
//语法
discard() 方法语法：
set.discard(value)
//参数
value -- 必需，要移除的元素
//返回值（如果要移除的元素不存在，则返回None）
None。

//实例
移除集合中的元素 banana：

实例 1
fruits = {"apple", "banana", "cherry"}
print(fruits.discard("name"))
输出结果为：
None

intersection() 返回集合的交集

//描述
intersection() 方法用于返回两个或更多集合中都包含的元素，即交集。
//语法
intersection() 方法语法：
set.intersection(set1, set2 ... etc)
//参数
set1 -- 必需，要查找相同元素的集合
set2 -- 可选，其他要查找相同元素的集合，可以多个，多个使用逗号 , 隔开
//返回值
返回一个新的集合。

//实例
返回一个新集合，该集合的元素既包含在集合 x 又包含在集合 y 中：

实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}
z = x.intersection(y) 
print(z)
输出结果为：
{'apple'}

计算多个集合：

//实例 2
x = {"a", "b", "c"}
y = {"c", "d", "e"}
z = {"f", "g", "c"}
result = x.intersection(y, z)
print(result)
输出结果为：
{'c'}

intersection_update() 删除集合中的元素，该元素在指定的集合中不存在。

//描述
intersection_update() 方法用于移除两个或更多集合中都不重叠的元素，即计算交集。
intersection_update() 方法不用于 intersection() 方法，因为 intersection() 方法是返回一个新的集合，而 intersection_update() 方法是在原始的集合上移除不重叠的元素（两个集合间除去不是交集的部分，也就是只留下交集的元素）。
//语法
intersection_update() 方法语法：
set.intersection_update(set1, set2 ... etc)
//参数
set1 -- 必需，要查找相同元素的集合
set2 -- 可选，其他要查找相同元素的集合，可以多个，多个使用逗号 , 隔开
//返回值
无。

//实例
返回一个新集合，该集合的元素既包含在集合 x 又包含在集合 y 中：

//实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}
x.intersection_update(y) 
print(x)
输出结果为：
{'apple'}

计算多个集合的交集：

//实例 2
x = {"a", "b", "c"}
y = {"c", "d", "e"}
z = {"f", "g", "c"}
x.intersection_update(y, z)
print(x)
输出结果为：
{'c'}

isdisjoint() 判断两个集合是否包含相同的元素（是否有交集），如果没有返回 True，否则返回 False。

//描述
isdisjoint() 方法用于判断两个集合是否包含相同的元素，如果没有返回 True，否则返回 False。。
//语法
isdisjoint() 方法语法：
set.isdisjoint(set)
//参数
set -- 必需，要比较的集合
//返回值
返回布尔值，如果不包含返回 True，否则返回 False。
//实例
判断集合 y 中是否有包含集合 x 的元素：

//实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "facebook"}
z = x.isdisjoint(y) 
print(z)
输出结果为：
True

如果包含返回 False：

//实例 2
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}
z = x.isdisjoint(y) 
print(z)
输出结果为：
False

issubset() 判断指定集合是否为该方法参数集合的子集。

//描述
issubset() 方法用于判断集合的所有元素是否都包含在指定集合中，如果是则返回 True，否则返回 False。
//语法
issubset() 方法语法：
set.issubset(set)
//参数
set -- 必需，要比查找的集合
//返回值
返回布尔值，如果都包含返回 True，否则返回 False。
//实例
判断集合 x 的所有元素是否都包含在集合 y 中：

//实例 1
x = {"a", "b", "c"}
y = {"f", "e", "d", "c", "b", "a"} 
z = x.issubset(y) 
print(z)
输出结果为：
True

如果没有全部包含返回 False：

//实例 2
x = {"a", "b", "c"}
y = {"f", "e", "d", "c", "b"}
z = x.issubset(y) 
print(z)
输出结果为：
False

issuperset() 判断该方法的参数集合是否为指定集合的子集(也就是指定集合是否是方法参数集合的父集)

//描述
issuperset() 方法用于判断指定集合的所有元素是否都包含在原始的集合中，如果是则返回 True，否则返回 False。
//语法
issuperset() 方法语法：
set.issuperset(set)
//参数
set -- 必需，要比查找的集合
//返回值
返回布尔值，如果都包含返回 True，否则返回 False。
//实例
判断集合 y 的所有元素是否都包含在集合 x 中（x是否是y的父集）

//实例 1
x = {"f", "e", "d", "c", "b", "a"}
y = {"a", "b", "c"}
z = x.issuperset(y) 
print(z)
输出结果为：
True

如果没有全部包含返回 False：

//实例 2
x = {"f", "e", "d", "c", "b"}
y = {"a", "b", "c"}
z = x.issuperset(y) 
print(z)
输出结果为：
False

pop() 随机移除元素

//描述
pop() 方法用于随机移除一个元素。
//语法
pop() 方法语法：
set.pop()
//参数
无
//返回值
返回移除的元素。
//实例
随机移除一个元素：

//实例 1
fruits = {"apple", "banana", "cherry"}
fruits.pop() 
print(fruits)
输出结果为：
{'apple', 'banana'}

输出返回值：

//实例 2
fruits = {"apple", "banana", "cherry"}
x = fruits.pop() 
print(x)
输出结果为：
banana

remove() 移除指定元素

//描述
remove() 方法用于移除集合中的指定元素。
该方法不同于 discard() 方法，因为 remove() 方法在移除一个不存在的元素时会发生错误，而 discard() 方法不会。

//语法
remove() 方法语法：
set.remove(item)
//参数
item -- 要移除的元素
//返回值
返回移除的元素。
//实例
移除元素 banana：

//实例 1
fruits = {"apple", "banana", "cherry"}
fruits.remove("banana") 
print(fruits)
输出结果为：
{'cherry', 'apple'}

symmetric_difference() 返回两个集合中不重复的元素集合。（对称差集）

//描述
symmetric_difference() 方法返回两个集合中不重复的元素集合，即会移除两个集合中都存在的元素。（除去交集的部分）
//语法
symmetric_difference() 方法语法：
set.symmetric_difference(set)
//参数
set -- 集合
//返回值
返回一个新的集合。
//实例
返回两个集合组成的新集合，但会移除两个集合的重复元素：

//实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}
z = x.symmetric_difference(y) 
print(z)
输出结果为：
{'google', 'cherry', 'banana', 'runoob'}

symmetric_difference_update()移除当前集合中在另外一个指定集合相同的元素，并将另外一个指定集合中不同的元素插入到当前集合中。

//描述

symmetric_difference_update() 方法移除当前集合中在另外一个指定集合相同的元素，并将另外一个指定集合中不同的元素插入到当前集合中。

//语法

symmetric_difference_update() 方法语法：

set.symmetric_difference_update(set)

//参数

set -- 要检测的集合

//返回值

无。

//实例

在原始集合 x 中移除与 y 集合中的重复元素，并将不重复的元素插入到集合 x 中：

//实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"} 
x.symmetric_difference_update(y)  
print(x)
输出结果为：
{'google', 'cherry', 'banana', 'runoob'}

union()返回两个集合的并集

//描述

union() 方法返回两个集合的并集，即包含了所有集合的元素，重复的元素只会出现一次。

//语法

union() 方法语法：

set.union(set1, set2...)

//参数

set1 -- 必需，合并的目标集合

set2 -- 可选，其他要合并的集合，可以多个，多个使用逗号 , 隔开。

//返回值

返回一个新集合。

//实例

合并两个集合，重复元素只会出现一次：

//实例 1
x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"} 
z = x.union(y)  
print(z)
输出结果为：
{'cherry', 'runoob', 'google', 'banana', 'apple'}

合并多个集合：

//实例 2
x = {"a", "b", "c"}
y = {"f", "d", "a"}
z = {"c", "d", "e"}
result = x.union(y, z) 
print(result)
输出结果为：
{'c', 'd', 'f', 'e', 'b', 'a'}

update()给集合添加元素

//描述

update() 方法用于修改当前集合，可以添加新的集合到当前集合中（括号中是集合）

//语法

update() 方法语法：

set.update(set)

//参数

set -- 必需，可以是元素或集合

//返回值

无。

//实例

合并两个集合，重复元素只会出现一次：

//实例 1

x = {"apple", "banana", "cherry"}
y = {"google", "runoob", "apple"}
x.update(y) 
print(x)
输出结果为：
{'banana', 'apple', 'google', 'runoob', 'cherry'}