Python基础三--字典,集合,编码,深浅copy,元祖、文件操作

字典 dict
数据类型划分:可变数据类型,不可变数据类型
不可变数据类型: 元组,bool值,int,str 可哈希
可变数据类型: list,dict,set 不可哈希

dict key :必须是不可变数据类型,可哈希,
value:任意数据类型。
dict 优点:二分查找法去查询
存储大量的关系型数据
特点:无序的

字典 dict的操作
    dic={'age': 18, 'name': 'jin', 'sex': 'male'}
#直接改变
    dic['height'] = 180 # 原来没有的键值对,无序添加
    dic['age'] = 32 #原来有键,值直接覆盖改变

# setdefault()    
    dic.setdefault('height',180)# 没有才能添加成功
    dic.setdefault('name','john')#有则不改变任何
    dic.setdefault('hobbie')   # 'hobbie': None

 

# pop()
#删除存在的键值对
    dic.pop('age')# 成功
    print(dic.pop('age')) # 18 会返回删除的值
#删除不存在的,设置返回值提醒不存在
    dic.pop('height') #没有的键,删除会报错
    dic.pop('height',None)# 加上None 不会报错,返回none
    print(dic.pop('height','没有此件')) # 可设置返回值
#用于大量数据时删除不知道是否存在的值
    dic.pop('name',None) # 成功 {'age': 18, 'sex': 'male'}

# popitem()
    print(dic.popitem())  # 随机删除 有返回值 返回 存在元组里面的 删除的键值。

# del
    del dic #删除字典
    del dic['name'] #删除键值对

#clear()
    dic.clear() # 清空

 改

#直接赋值
    dic['age'] = 32 #原来有键,值直接覆盖改变

#update
    dic2 = {'sex':'female','weight':75}
    dic2.update(dic) # 改变dic2 把后面的覆盖和添加到前面

 查   

在循环一个列表时,最好不要删除列表中的元素,这样会使索引发生改变,从而报错。
#
    print(dic.keys(),type(dic.keys()))
    #dict_keys(['age', 'sex', 'name']) <class 'dict_keys'>
    print(dic.values(),type(dic.values()))
    #dict_keys(['age', 'sex', 'name']) <class 'dict_keys'>
    print(dic.items(),type(dic.items()))
    #dict_items([('age', 18), ('name', 'jin'), ('sex', 'male')]) <class 'dict_items'>

#循环去查
    for i in dic: # 仅返回键 同dic.keys()一样
    for i in dic.keys(): #返回键
    for i in dic.values():# 返回值
       print(i)
#Python:找一一对应的最小单位
    for i in dic.items():
    print(i)     # ('age', 18)('name', 'jin')('sex', 'male')
    for k,v in dic.items() :
    print(k,v)  # name jin    sex male    age 18

#直接赋值去查
    v1 = dic['name']
    print(v1)
    v2 = dic['name1']  # 报错
    print(v2)

# get()
  print(dic.get('name1',"默认返回值") # 返回设定的返回值,默认返回none,防止报错

formkeys()   已知键,添加值。(可覆盖)

dic = dict.fromkeys([1,2,3],'春哥')
print(dic)   #{1: '春哥', 2: '春哥', 3: '春哥'}
dic = dict.fromkeys([1,2,3],[])
print(dic)   # {1: [], 2: [], 3: []}
dic[1].append('袁姐')
print(dic)   # {1: ['袁姐'], 2: ['袁姐'], 3: ['袁姐']}
dic[2].extend('二哥')
print(dic)   # {1: ['袁姐', '二', '哥'], 2: ['袁姐', '二', '哥'], 3: ['袁姐', '二', '哥']}

编码

1,各个编码之间的二进制,是不能互相识别的,会产生乱码。
2,文件的储存,传输,不能是unicode(只能是utf-8 utf-16 gbk,gb2312,asciid等)
ascii
            A : 00000010  8位 一个字节

unicode     A : 00000000 00000001 00000010 00000100 32位  四个字节
            中:00000000 00000001 00000010 00000110 32位  四个字节


utf-8       A :  00100000 8位 一个字节
            中:  00000001 00000010 00000110 24位 三个字节


gbk         A : 00000110  8位 一个字节
            中 : 00000010 00000110 16位 两个字节
py3:
    str 在内存中是用unicode编码。
        bytes类型
        对于英文:
             str  :表现形式:s = 'alex'
                    编码方式: 010101010  unicode
            bytes :表现形式:s = b'alex'
                    编码方式: 000101010  utf-8 gbk。。。。

        对于中文:
             str  :表现形式:s = '中国'
                    编码方式: 010101010  unicode
            bytes :表现形式:s = b'xe91e91e01e21e31e32'
                    编码方式: 000101010  utf-8 gbk。。。。
    s1 = 'alex'
# encode 编码,如何将str --> bytes, ()
    s11 = s1.encode('utf-8')
    s11 = s1.encode('gbk')
    print(s11)
    s2 = '中国'
    s22 = s2.encode('utf-8')
    s22 = s2.encode('gbk')
    print(s22)

 中文一定要用什么编码就用什么解码,英文则不必。

    # str --->byte  encode 编码
    s = '二哥'
    b = s.encode('utf-8')
    print(b)

    #byte --->str decode 解码
    s1 = b.decode('utf-8')
    print(s1)

集合

集合是无序的,不重复的数据集合,它里面的元素是可哈希的(不可变类型),但是集合本身是不可哈希(所以集合做不了字典的键)的。以下是集合最重要的两点:

  去重,把一个列表变成集合,就自动去重了。

  关系测试,测试两组数据之前的交集、差集、并集等关系。

集合的创建

    set1 = set({1,2,'barry'})
    set2 = {1,2,'barry'}
    print(set1,set2)  # {1, 2, 'barry'} {1, 2, 'barry'}

集合的操作

    set1 = {'alex','wusir','ritian','egon','barry'}
    
    set1.add('景女神')
    print(set1)

    #update:迭代着增加
    set1.update('A')
    print(set1)
    set1.update('老师')
    print(set1)
    set1.update([1,2,3])
    print(set1)
    set1 = {'alex','wusir','ritian','egon','barry'}

    set1.remove('alex')  # 删除一个元素
    print(set1)

    set1.pop()  # 随机删除一个元素
    print(set1)

    set1.clear()  # 清空集合
    print(set1)

    del set1  # 删除集合
    print(set1)
    for i in set1:
        print(i)

集合的其他操作

交集。(&  或者 intersection)

set1 = {1,2,3,4,5}
set2 = {4,5,6,7,8}
print(set1 & set2)  # {4, 5}
print(set1.intersection(set2))  # {4, 5}
View Code

并集。(| 或者 union)

set1 = {1,2,3,4,5}
set2 = {4,5,6,7,8}
print(set1 | set2)  # {1, 2, 3, 4, 5, 6, 7}

print(set2.union(set1))  # {1, 2, 3, 4, 5, 6, 7}
View Code

 差集。(- 或者 difference)

set1 = {1,2,3,4,5}
set2 = {4,5,6,7,8}
print(set1 - set2)  # {1, 2, 3}
print(set1.difference(set2))  # {1, 2, 3}
View Code

反交集。 (^ 或者 symmetric_difference)

set1 = {1,2,3,4,5}
set2 = {4,5,6,7,8}
print(set1 ^ set2)  # {1, 2, 3, 6, 7, 8}
print(set1.symmetric_difference(set2))  # {1, 2, 3, 6, 7, 8}
View Code

子集与超集

set1 = {1,2,3}
set2 = {1,2,3,4,5,6}

print(set1 < set2)
print(set1.issubset(set2))  # 这两个相同,都是说明set1是set2子集。

print(set2 > set1)
print(set2.issuperset(set1))  # 这两个相同,都是说明set2是set1超集。
View Code

frozenset不可变集合,让集合变成不可变类型。

s = frozenset('barry')
print(s,type(s))  # frozenset({'a', 'y', 'b', 'r'}) <class 'frozenset'>
for i in s:
print(i)
# y
# r
# a
# b

深浅copy

1 赋值运算               对于赋值运算来说,l1与l2指向的是同一个内存地址,所以他们是完全一样的。

l1 = [1,2,3,['barry','alex']]
l2 = l1

l1[0] = 111
print(l1)  # [111, 2, 3, ['barry', 'alex']]
print(l2)  # [111, 2, 3, ['barry', 'alex']]

l1[3][0] = 'wusir'
print(l1)  # [111, 2, 3, ['wusir', 'alex']]
print(l2)  # [111, 2, 3, ['wusir', 'alex']]
复制代码

2 浅拷贝copy

l1 = [1,2,3,['barry','alex']]

l2 = l1.copy()
print(l1,id(l1))  # [1, 2, 3, ['barry', 'alex']] 2380296895816
print(l2,id(l2))  # [1, 2, 3, ['barry', 'alex']] 2380296895048
l1[1] = 222
print(l1,id(l1))  # [1, 222, 3, ['barry', 'alex']] 2593038941128
print(l2,id(l2))  # [1, 2, 3, ['barry', 'alex']] 2593038941896
 
l1[3][0] = 'wusir'
print(l1,id(l1[3]))  # [1, 2, 3, ['wusir', 'alex']] 1732315659016
print(l2,id(l2[3]))  # [1, 2, 3, ['wusir', 'alex']] 1732315659016
View Code

对于浅copy来说,第一层创建的是新的内存地址,而从第二层开始,指向的都是同一个内存地址,所以,对于第二层以及更深的层数来说,保持一致性。

3 深拷贝deepcopy

import copy
l1 = [1,2,3,['barry','alex']]
l2 = copy.deepcopy(l1)

print(l1,id(l1))  # [1, 2, 3, ['barry', 'alex']] 2915377167816
print(l2,id(l2))  # [1, 2, 3, ['barry', 'alex']] 2915377167048

l1[1] = 222
print(l1,id(l1))  # [1, 222, 3, ['barry', 'alex']] 2915377167816
print(l2,id(l2))  # [1, 2, 3, ['barry', 'alex']] 2915377167048

l1[3][0] = 'wusir'
print(l1,id(l1[3]))  # [1, 222, 3, ['wusir', 'alex']] 2915377167240
print(l2,id(l2[3]))  # [1, 2, 3, ['barry', 'alex']] 2915377167304
View Code

对于深copy来说,两个是完全独立的,改变任意一个的任何元素(无论多少层),另一个绝对不改变

 4 文件操作

文件名.txt
1,文件路径:d:文件名.txt
2,编码方式:utf-8 gbk 。。。。
3,操作方式:只读,只写,追加,读写,写读.....
以什么编码方式储存的文件,就以什么编码打开进行操作。
        r
        rb
        f = open('文件名',mode='r',encoding='utf-8')
        content = f.read()
        print(content,type(content))
        f.close()

        f = open('文件名',mode='rb',)
        content = f.read()
        print(content)
        f.close()

        r+ 读写
        r+b 读写(以bytes类型)
        f = open('log',mode='r+',encoding='utf-8')
        print(f.read())
        f.write('大猛,小孟')
        f.close()

        f = open('log',mode='r+b')
        print(f.read())
        f.write('大猛,小孟'.encode('utf-8'))
        f.close()
只读,读写
    
         f = open('log',mode='a',encoding='utf-8')
         f.write('佳琪')
         f.close()

         f = open('log',mode='ab')
         f.write('佳琪'.encode('utf-8'))
         f.close()
追加
    w     #对于w:没有此文件就会创建文件
    wb   # 先将源文件的内容全部清除,在写。
    先将源文件的内容全部清除,在写。
    f = open('log',mode='w',encoding='utf-8')
    f.write('附近看到类似纠纷')
    f.close()

    f = open('log',mode='wb')
    f.write('附近看到类似纠纷'.encode('utf-8'))
    f.close()
    
    w+
    f = open('log',mode='w+',encoding='utf-8')
    f.write('aaa')
    f.seek(0)
    print(f.read())
    f.close()
    w+b
    .......
只写、写读
f = open('log',mode='r+',encoding='utf-8')
content = f.read(3)  # 读出来的都是字符

f.seek(3)  # 是按照字节定光标的位置

f.tell() #告诉你光标的位置
print(f.tell())

f.readable()  # 是否可读

f.truncate(4)# 再源文件上截取打印

line = f.readline()  # 一行一行的读

line = f.readlines()  # 每一行当成列表中的一个元素,添加到list中
for line in f:
    print(line)
功能详解 f.seek(0)    移动到最开始    f.seek(0,2)  移动到最末尾
# f = open('log',mode='a+',encoding='utf-8')
# f.write('佳琪')
# count = f.tell()
# f.seek(count-9)
# print(f.read(2))
# f.close()
原文地址:https://www.cnblogs.com/olivia2018/p/8075403.html