第七天

字符编码

前置知识点：

1、程序执行的三大核心硬件（***）：

cpu 内存硬盘

正常执行一个程序的要点：

1、将硬盘中的数据读到内存 2、由cpu读内存中的数据进行执行 3、在执行程序的时候，生成的数据，优先存入内存

2、python解释器执行一个py文件过程（***）
    如果没有python解释器，py文件单纯就是一个文本文件
    所以说，想执行py文件，必须先执行python解释器

    1、将python解释器的代码有硬盘读到内存
    2、将py文件以普通文本文件的格式由硬盘读到内存
    3、python解释器去内存中读取py文件的数据
    4、识别python语法，执行相应的操作

    ps：任何一个文本编辑器的执行，前两部都一样

字符编码：

字符：世界上一切语言、文字有必要考虑，图片文件、音频文件、视频文件？

文件的输入和输出是两个过程

人类输入的内容都是人类自己可以识别的字符

计算机只能识别0101010二进制字符

将人类的字符，存入内存和硬盘，要经历一个过程：

人类的字符  >>>>>>>     （字符编码表）    >>>> 计算机二进制

0 a
1 b
01 a
10 b
00 c
11 d

ASCII码表（美国）
    用八位二进制来代表一个英文字符（所有的英文字符+符号一共大概128左右）
        0000 0000
        1111 1111
        最多只能表示255位

    八位二进制 = 8 bit
    8 bit = 1 bytes
    1024bytes = 1KB
    1024KB = 1MB
    1024MB = 1GB
    1024GB = 1TB
    1024TB = 1PB

GBK(中国)
    用2个bytes来代表一个字符，兼容英文字符
    0000 0000 0000 0000
    1111 1111 1111 1111
    最多可以表示65535位

shift（小日子过得不错的日本人）

fuck（韩国的）

万国码（unicode）

为了兼容所有的国家的字符，生成unicode
    所有的字符都用2bytes
    0101 0101 a
    0000 0000 0101 0101 a
    1、占用存储空间
    2、io次数增加，程序运行速度变慢（最致命）

在unicode二进制数据存入硬盘的时候，做优化

utf-8:
    utf-8只与unicode有对应关系
    unicode transformation format

    所有的英文字符用1个bytes表示
    所有的中文字符用3个bytes表示

现在的计算机：
    内存都是：unicode
    硬盘都是：utf-8

需要掌握：
    1、用户无论输入什么字符，存入内存，unicode都可以兼容
    2、硬盘中无论是什么编码的文件，读到内存，都可以兼容unicode

数据的传输：
    优先以自己的本国字符编码进行传递

必须掌握（******）
    (内存)unicode二进制字符 >>>  编码(encode)  >>> (硬盘)utf-8二进制字符
    (硬盘)utf-8二进制字符  >>>   解码(decode)  >>> (内存)unicode二进制字符

(******)
保证不乱码核心：
    用什么编码存的数据，就用什么编码取

python2 :
    默认的字符编码ascii码（因为当时的unicode还没盛行）
python3：
    默认的字符编码utf-8

文件头：
    # coding:utf-8
    用英文字符，是为了让所有的计算机都可以识别

pycharm默认的字符编码是：
    utf-8
windows操作系统默认字符编码：
    gbk

深浅拷贝

深拷贝列表的id和原列表不一样，值的id也不一样，改变拷贝列表里的值，原列表不受影响

浅拷贝列表id和原列表不一样，其他和深拷贝相反

import copy   # 首先导入copy
l1 = [257, 'a', [4, 5, 6]]  
print(l1)
print(id(l1))
# print(id(l1[0]))     
l3 = l1.copy    # 浅copy（用的不多）
l2 = copy.deepcopy(l1)  #  深copy[1, 'a', [4, 5, 6]]
l2[2][0] = 4444  
print(l2)
print(id(l2))
print("l1:", l1)
print("id_l1:", id(l1))

文件处理

什么是文件

操作系统提供给你操作硬盘的一个工具

为什么要用文件

因为人类和计算机要永久保存数据

怎么用文件

相对路径：a.txt 必须与当前py文件在同一级目录

绝对路径：D:项目路径python13期day07a.txt

'r'            以只读的方式打开文件（默认）
'w'            以写入的方式打开文件，会覆盖已存在的文件
'x'            如果文件已存在，用次模式打开会引发异常
'a'            以写入模式打开，如果文件存在，在末尾追加写入
'b'            以二进制打开，图片，视频
't'            以文本打开
'+'            可读写模式
'u'            通用换行

# f = open("a.txt")
#
# print(f.readable())  # 判断当前文件是否可读
# print(f.writable())  # 判断当前文件是否可写
#
# # del f  # 回收变量资源
# f.close()  # 回收操作系统的资源


# with open('a.txt',mode='r')as rf,
#         open('a.txt',mode='w')as wf:  # with会自动帮你回收操作系统的资源，无需自己操作
#     print(rf.readable())
#     print(wf.writable())

# r进行转义
with open(r'D:项目路径python13期day07a.txt')as f:
    print(f.read())   # 读取文件

文件打开模式

"""
打开文件的三种模式：
    r :
        1、只读
        2、如果文件不存在，会报错
    w：（慎用）
        1、只写
        2、如果文件不存在，则新建一个文件写入数据
        3、如果文件内存在数据，会将数据清空，重新写入
    a：
        1、追加写
        2、如果文件内存在数据，会在已有数据的后面追加数据
        3、如果文件不存在，则新建一个文件写入数据
处理文件的模式：
    t
    b
0  
# with open(r'dir.txt','r',encoding='gbk')as f:
#     print(f.readable())
# print(f.read())
# print(f.readline())  # 执行一次，打印一行内容
# print(f.readlines())
# print(f.read())
# print(f.readable())
# print(f.read())
# for i in f:
#     print(i)


# with open(r'dir.txt', 'w', encoding='gbk')as f:
#     # f.write("上海校区第一帅-sean")
#     f.writelines(["上午没翻车
",'我很高兴'])


# with open(r'diraaaaa.txt','a',encoding='gbk')as f:
    # print(f.writable())
    # f.write("
翻车是不可能的")