文件操作

一，文件操作基本流程。

计算机系统分为：计算机硬件，操作系统，应用程序三部分。

我们用python或其他语言编写的应用程序若想要把数据永久保存下来，必须要保存于硬盘中，这就涉及到应用程序要操作硬件，众所周知，应用程序是无法直接操作硬件的，这就用到了操作系统。操作系统把复杂的硬件操作封装成简单的接口给用户/应用程序使用，其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念，用户或应用程序通过操作文件，可以将自己的数据永久保存下来。

有了文件的概念，我们无需再去考虑操作硬盘的细节，只需要关注操作文件的流程：

#1. 打开文件，得到文件句柄并赋值给一个变量
f=open('a.txt',mode='r',encoding='utf-8') #默认打开模式就为r

#2. 通过句柄对文件进行操作
data=f.read()

#3.f.flush()         # 刷新管道

#4.f.close()         #关闭文件

使用with关键字来管理上下文,文件件运行完后会自动关闭，不用写f.close()
with open('a.txt','w') as f:
    pass
可以一次性操作多个文件句柄 
with open('a.txt','r') as read_f,open('b.txt','w') as write_f:
    data=read_f.read()
    write_f.write(data)

二，文件编码

f=open(...)是由操作系统打开文件，那么如果我们没有为open指定编码，那么打开文件的默认编码很明显是操作系统说了算了，

操作系统会用自己的默认编码去打开文件，在windows下是gbk，在linux下是utf-8。

#这就用到了上节课讲的字符编码的知识：若要保证不乱码，文件以什么方式存的，就要以什么方式打开。
f=open('a.txt','r',encoding='utf-8')

三，文件的打开模式

文件句柄 = open（‘文件路径’，‘模式’）

#1. 打开文件的模式有(默认为文本模式)：
r ，只读模式【默认模式，文件必须存在，不存在则抛出异常】
w，只写模式【不可读；不存在则创建；存在则清空内容】
a， 只追加写模式【不可读；不存在则创建；存在则只追加内容】

#2. 对于非文本文件，我们只能使用b模式，"b"表示以字节的方式操作（而所有文件也都是以字节的形式存储的，
    使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式）
rb 
wb
ab
注：以b方式打开时，读取到的内容是字节类型，写入时也需要提供字节类型，不能指定编码

#3,‘+’模式（就是增加了一个功能）
r+， 读写【可读，可写】
w+，写读【可写，可读】
a+， 写读【可写，可读】

#4，以bytes类型操作的读写，写读，写读模式
r+b， 读写【可读，可写】
w+b，写读【可写，可读】
a+b， 写读【可写，可读】

四，文件操作方法。

4.1常用操作方法。

read（3）：

　　1. 文件打开方式为文本模式时，代表读取3个字符

　　2. 文件打开方式为b模式时，代表读取3个字节

　　其余的文件内光标移动都是以字节为单位的如：seek，tell，truncate

注意：

　　1. seek有三种移动方式0，1，2，其中1和2必须在b模式下进行，但无论哪种模式，都是以bytes为单位移动的

　　2. truncate是截断文件，所以文件的打开方式必须可写，但是不能用w或w+等方式打开，因为那样直接清空文件了，所以truncate要在r+或a或a+等模式下测试效果。

绝对路径：从磁盘根目录寻找文件

相对路径：相对于你当前文件所在的位置（运行文件时，不用写路径，直接写文件名）

read：一次性全部读出来

　　readline:一行一行读

　　readlines:一次性全部读出来，以行为单位放在一个列表中

　　read(n):读一部分

　　for:循环读取不占内存，最好

write:

w
#没有文件，创建一个文件写入内容
# f = open('log1',encoding='utf-8',mode='w')
# f.write('儿科王金发')
# f.close()
#有文件，将原文件内容清空，在写入内容。
# f = open('log1',encoding='utf-8',mode='w')
# f.write('666')
# f.close()

# wb
# f = open('log',mode='wb')
# f.write('老男孩教育'.encode('utf-8'))
# f.close()

# a
#没有文件，创建一个文件追加内容
# f = open('log2',encoding='utf-8',mode='a')
# f.write('666')
# f.close()
# 有文件，直接追加内容。
# f = open('log2',encoding='utf-8',mode='a')
# f.write('666')
# f.close()

# r+ 先读，后追加 一定要先读后写       在r+模式下，如果读取了内容，不论读取内容多少，光标显示的是多少，再写入或者操作文件时都是在结尾进行操作
# f = open('log',encoding='utf-8',mode='r+')
# content = f.read()
# print(content)
# f.write('aaa')
# f.close()

# w+ 先写后读。
# f = open('log',encoding='utf-8',mode='w+')
# f.write('中国')
# #print(f.tell())  # 按字节去读光标位置
# f.seek(3)  # 按照字节调整光标位置          seek(0,2)光标移到结尾，seek（0）光标移到开头
# print(f.read())
# f.close()

#a+ 追加读，在最后追加内容，在读。（读不到内容）
# f = open('log',encoding='utf-8',mode='a+')
# f.write('BBB')
# content = f.read()
# print(content)
# f.close()

# f = open('log',encoding='utf-8',mode='a')
# f.truncate(7) # 按字节对原文件截取
# f.close()
如果没有参数. 根据光标的位置. 保留光标前面的内容，后面的内容删除。  f.truncate()
如果给了参数. 会把文件从头到参数之间的内容保留，其他的全部删掉   f.truncate(7)

修改文件内容：
# 1，将原文件读取到内存。
# 2，在内存中进行修改，形成新的内容。
# 3，将新的字符串写入新文件。
# 4，将原文件删除。
# 5，将新文件重命名成原文件。
import os
with open('log',encoding='utf-8') as f1,
    open('log.bak',encoding='utf-8',mode='w') as f2:
    for i in f1:
        new_i = i.replace('SB','alex')
        f2.write(new_i)
os.remove('log')
os.rename('log.bak','log')