基础数据补充 set() 集合深浅拷贝

一对字符串的操作

li = ["张曼玉", "朱茵", "关之琳", "刘嘉玲"]
s = "_".join(li)
print(s)            # 张曼玉_朱茵_关之琳_刘嘉玲


li = "哈哈哥"
s = "_".join(li)
print(s)                  # 哈_哈_哥

#######  经过 join() 处理之后 就会变成字符串 

li = "哈哈哥,嘻嘻姐,呵呵妹"
s = li.split(",")
print(s)                ## ['哈哈哥', '嘻嘻姐', '呵呵妹']

######   经过 split() 处理之后,会变成  列表  
## 他俩是 字符串 和 列表的 相互转化

二列表循环删除列表的每一个元素

## for 循环原理:

　　for 的运行过程,会有一个指针来记录当前循环的元素是哪一个,一开始这个指针指向第0个,然后获取到第0个元素,紧接着删除第0个元素,这个时候.原来是第一个的元素会自动变成第0个,相当于向前移动补位了.然后指针向后移动一次,指向2 元素,这个时候 1向前移动了,也就不会再删除了, 包括列表的 remove 和 pop 都是删除不干净的

# 只有这样才是可以 的

li = ["张曼玉","朱茵","关之琳","邱淑贞"]

for  i in range(len(li)):  ## 循环 len(li)次,然后从后往前删
    li.pop()
print(li)


li = ["张曼玉","朱茵","关之琳","邱淑贞"]
lst = []

for i in li:
    lst.append(i)

for el in lst:
    li.remove(el)
print(li)

### 循环老列表,把要删除的元素放进新的列表中
###  循环新的列表,得到要删除的元素,用 remove()的 指名道姓删除的特###  性,进项删除



## 简单说:循环老列表删除新列表

三 set 集合

　　set 集合是python的一个基础数据类型,不常用,set 中的元素是不重复的,无序的 ,里边的元素必须是可 hash 的

也就是不可变的数据类型 (int,str,tuple,bool) 也可以这样理解: set 就是 dict 类型数据的 key,定义的时候是set(),

用 {} 表示

## 注意 set 集合中的元素必须是可 hash的,但是本身是不可 hash 的 ,set 是可变的

set1 = {'1','alex',2,True,[1,2,3]} # 报错
set2 = {'1','alex',2,True,{1:2}} # 报错
set3 = {'1','alex',2,True,(1,2,[2,3,4])} # 报错

## 注意 set 集合是无序的,不重复的

s = {"周杰伦", "周杰伦", "周星星"}
print(s)
结果:
{'周星星', '周杰伦'}


## 利用这个机制,可以把列表转化成 set集合,去重,再 转化成列表
##  这个是 python 中去重最快的,没有之一
## 唯一的不足就是,set 无序,转化之后需要重新排序
## python中 去重比较麻烦,排序就简单多了
## 和set 的去重相比较,这个无序,可以忽略不计了

# 给list去重复
lst = [45, 5, "哈哈", 45, '哈哈', 50]
lst = list(set(lst)) # 把list转换成set, 然后再转换回list
print(lst)

## set 集合的增删改查

1.增

s = {"刘嘉玲", '关之琳', "王祖贤"}
s.add("郑裕玲")
print(s)                 #  {'关之琳', '郑裕玲', '王祖贤', '刘嘉玲'}
s.add("郑裕玲") # 重复的内容不会被添加到set集合中
print(s)

s = {"刘嘉玲", '关之琳', "王祖贤"}
s.update("麻花藤") # 迭代更新
print(s)                  #{'花', '麻', '关之琳', '王祖贤', '刘嘉玲', '藤'}

s = {"刘嘉玲", '关之琳', "王祖贤"}

s.update(["张曼玉", "李若彤","李若彤"])
 print(s)                # {'刘嘉玲', '关之琳', '王祖贤', '李若彤', '张曼⽟'}

2.删

s = {"刘嘉玲", '关之琳', "王祖贤","张曼玉", "李若彤"}
item = s.pop()          # 随机弹出一个.
print(s)
print(item)

## pop是有 返回值的

s = {"刘嘉玲", '关之琳', "王祖贤","张曼玉", "李若彤"}
s.remove("关之琳")      # 直接删除元素
s.remove("麻⻁疼")    # 不存在这个元素. 删除会报错
print(s)

s = {"刘嘉玲", '关之琳', "王祖贤","张曼玉", "李若彤"}
s.clear()               # 清空set集合.需要注意的是set集合如果是空的. 打印出            
                        #           来是set() 因为要和dict区分的.
print(s)                # set()

3.改

# set 集合中的 数据没有索引,也没有办法去定位一个元素,所以没办法进行直 
# 接修改,我们可以采用先 删除 再 添加的方式来完成 修改操作

s = {"刘嘉玲", '关之琳', "王祖贤","张曼玉", "李若彤"}
## 把  张曼玉  改成  朱茵
s.remove("张曼玉")
s.add("朱茵")
print(s)

4.查

#  set 是一个可 迭代对象 ,所以 可以进行 for 循环


s = {"刘嘉玲", '关之琳', "王祖贤","张曼玉", "李若彤"}

for el in s:
    print(el)

5.常用操作

s1 = {"刘嘉玲", '关之琳'}
s2 = {"王祖贤","张曼玉", "李若彤","刘嘉玲"}

# 交集   &   两个集合公有的 元素
print(s1 & s2)    #  {'刘嘉玲'}
print(s1.intersection(s2))  # {'刘嘉玲'}

# 并集    |     两个集合所有的元素合并到一起,重复的自动去掉

print(s1 | s2)       # {'张曼玉', '李若彤', '王祖贤', '刘嘉玲', '关之琳'}
print(s1.union(s2))   # {'张曼玉', '李若彤', '王祖贤', '刘嘉玲', '关之琳'}

## 差集  -  得到第一个集合 单独存在的元素
print(s1 - s2)             # {'关之琳'}
print(s1.difference(s2))   # {'关之琳'}


## 反交集   ^ 两个集合中单独存在的数据 

print(s1 ^ s2)       ## {'王祖贤', '关之琳', '李若彤', '张曼玉'}
print(s1.symmetric_difference(s2))

##  子集  <    判断 是不是   True  False
##  如果 s1 里边的元素 在 s2中 全部存在 就是 子集

print(s1 < s2)
print(s1.issubset(s2))    # False


## 超级  >  
print(s1 > s2)
print(s1.issuperset(s2))   #False

## set 集合本身是可以发生改变的 ,是不可 hash 的, 也就是可变的 ,我们可以使用冻结集合来保存数据

## frozenset (不可变集合) 也就变成了一个可哈希的数据类型

s = frozenset(["王祖贤","张曼玉", "李若彤","刘嘉玲"])
dic = {s:"123"}  #可以正常使用了
print(dic)   # {frozenset({'刘嘉玲', '李若彤', '张曼⽟', '王祖贤'}): '123'}

四深浅拷贝

lst = ["王祖贤","张曼玉", "李若彤","刘嘉玲","朱茵"]
lst1 = lst
print(lst1)
print(lst)
# 结果:
#['王祖贤', '张曼玉', '李若彤', '刘嘉玲', '朱茵']
#['王祖贤', '张曼玉', '李若彤', '刘嘉玲', '朱茵']

lst.append("张敏")
print(lst)
print(lst1)
# 结果:
#['王祖贤', '张曼玉', '李若彤', '刘嘉玲', '朱茵', '张敏']
#['王祖贤', '张曼玉', '李若彤', '刘嘉玲', '朱茵', '张敏']

print(id(lst))   # 24849304
print(id(lst1))  # 24849304    内存地址是一样的

## 对于 list set dict 来说,直接赋值,其实是把内存地址交给变量,并不是复制一份内容 ,所以 lst 和 lst1 的内存## 指向是一样的, lst 改变了,lst1 也发生了改变

1.浅拷贝

lst1 = ["刘备","关羽","张飞","曹操","孙权"]
lst2 = lst1.copy()
lst1.append("诸葛亮")

print(lst1)
print(lst2)

print(id(lst1),id(lst2))

"""
['刘备', '关羽', '张飞', '曹操', '孙权', '诸葛亮']
['刘备', '关羽', '张飞', '曹操', '孙权']

26553240 26422168
"""
## 结果 两个lst 完全不一样,内存地址和内容也不一样,实现了 内存的拷贝

lst1 = ["刘备",["关羽","张飞"],"曹操","孙权"]
lst2 = lst1.copy()

lst1[1].append("诸葛亮")
print(lst1)
print(lst2)

print(id(lst1),id(lst2))

"""
['刘备', ['关羽', '张飞', '诸葛亮'], '曹操', '孙权']
['刘备', ['关羽', '张飞', '诸葛亮'], '曹操', '孙权']
21244824 21380432

"""

lst1 = ["刘备",["关羽","张飞"],"曹操","孙权"]
lst2 = lst1.copy()

print(id(lst1[0]))
print(id(lst2[0]))
## 结果是

20904368
20904368

#### 浅拷贝: 只会拷贝第一层,第二层的内容不会拷贝,所以称为浅拷贝

2.深拷贝

import copy
lst1 = ["刘备",["关羽","张飞"],"曹操","孙权"]
lst2 = copy.deepcopy(lst1)

lst1[1].append("诸葛亮")

print(lst1)
print(lst2)

print(id(lst1),id(lst2))

"""
['刘备', ['关羽', '张飞', '诸葛亮'], '曹操', '孙权']
['刘备', ['关羽', '张飞'], '曹操', '孙权']
24652696 24788304
"""

### 都不一样了,深度拷贝,把元素内部的元素完全进行拷贝复制,不会产生一个改变另一个跟着改变的问题

a = [1, 2]
a[1] = a
print(a[1])



##  结果是

#  [1,[...]]

print(s)

基础数据 补充 set() 集合 深浅拷贝

基础数据补充 set() 集合深浅拷贝