文件操作

### 文件操作

```
#打开模式 
w   write 写入模式      
	文件不存在则创建文件,存在的话则打开清空内容,并且将文件指针放在文件的开头

r   read  读取模式
	文件不存在则报错! 存在的话则打开文件,并且将文件指针放在文件的开头

a   append 追加模式
	文件不存在则创建文件,存在的话则打开文件,*并且将文件指针放在文件的末尾*

x   xor 异或模式
	文件已存在则报错! 不存在的话则创建文件,将文件指针放在文件的开头

#扩展模式 (配合打开模式的辅助模式,自己单独不能使用)
    +   plus   增强模式(可以让文件具有读写功能)       
    b   bytes  bytes模式(二进制字节流)

#模式一共16种
    w,w+,wb,wb+
    r,r+,rb,rb+
    a,a+,ab,ab+
    x,x+,xb,xb+  
```

```
# 将字符串和字节流(Bytes流)类型进行转换 (参数写成转化的字符编码格式)
    #encode() 编码  将字符串转化为字节流(Bytes流)
    #decode() 解码  将Bytes流转化为字符串
```

```
# (utf-8编码格式下 默认一个中文三个字节 一个英文或符号 占用一个字节)
    #read()		功能: 读取字符的个数(里面的参数代表字符个数)
    #seek()		功能: 调整指针的位置(里面的参数代表字节个数)
    #tell()		功能: 当前光标左侧所有的字节数(返回字节数)
```

```
# 刷新缓冲区 flush
    # 当文件关闭的时候自动刷新缓冲区
    # 当整个程序运行结束的时候自动刷新缓冲区
    # 当缓冲区写满了  会自动刷新缓冲区
    # 手动刷新缓冲区
```

### with语法

```
# with 语法 自动关闭文件 相当于帮你执行了fp.close()
```

### 文件相关函数

```
#readline()     功能: 读取一行文件内容
#readlines()    功能:将文件中的内容按照换行读取到列表当中
#writelines()   功能:将内容是字符串的可迭代性数据写入文件中 参数:内容为字符串类型的可迭代数据
#truncate()     功能: 把要截取的字符串提取出来,然后清空内容将提取的字符串重新写入文件中 (字节)
#readable()	    功能: 判断文件对象是否可读
#writable()	    功能: 判断文件对象是否可写
```

### 字符相关的(了解)

```
#字符:无论是什么语言,独立的一个文字就是一个字符
#存储单位:
    Byte字节
    bit:位  
    1B = 8b
    B:字节, 1Byte = 8bit
    
#字符大小:
    无论何种字符集:英文和数字都是一个字节,汉字,韩文,日文等亚洲文字采用多个字节存储
    GB系列编码:存储一个汉字使用2个字节 (国标编码:例如: gbk2312 )
    UTF系列编码:存储一个汉字使用3个字节(国际通用:例如: utf-8 )

#字符编码种类: (把编码看成一个密码本,每一个字符在计算机中都是个二进制)
    英文原始编码:
    ASCII码 -> 最早的字符编码格式->仅支持英文和特定的符号
    
    中文编码:
    GB2312 : 包含5000个常用汉字的标准
    GB18030: 升级版本的标准,大概15000个汉字
    GBK    : 包含所有中文汉字的编码(推荐)
    BIG5   : 繁体中文编码       
    
    万国码:
    unicode 包含世界上所有的文字(无论什么字符 都按照4个字节表示)
    utf-8   可变长的unicode编码
```

  

原文地址:https://www.cnblogs.com/huangjiangyong/p/10829143.html