文件操作

一，文件操作基本流程。

# 1.打开文件，产生文件句柄
# 2.操作文件句柄
# 3.关闭文件句柄
# f1 = open('11.txt',encoding='utf-8', mode='r')
# content = f1.read()
# print(content)
# f1.close()
# f1， 文件句柄，文件对象
# 约定俗称： file, f_handle ,file_handle, f_obj ,f1
# open 打开的指令，windows的指令

关闭文件的注意事项：

打开一个文件包含两部分资源：操作系统级打开的文件+应用程序的变量。在操作完毕一个文件时，必须把与该文件的这两部分资源一个不落地回收，回收方法为：
1、f.close() #回收操作系统级打开的文件
2、del f #回收应用程序级的变量

其中del f一定要发生在f.close()之后，否则就会导致操作系统打开的文件还没有关闭，白白占用资源，
而python自动的垃圾回收机制决定了我们无需考虑del f，这就要求我们，在操作完毕文件后，一定要记住f.close()

虽然我这么说，但是很多同学还是会很不要脸地忘记f.close(),对于这些不长脑子的同学，我们推荐傻瓜式操作方式：使用with关键字来帮我们管理上下文
with open('a.txt','w') as f:
    pass
 
with open('a.txt','r') as read_f,open('b.txt','w') as write_f:
    data=read_f.read()
    write_f.write(data)

二，文件编码

f=open(...)是由操作系统打开文件，那么如果我们没有为open指定编码，那么打开文件的默认编码很明显是操作系统说了算了

# windows默认编码方式是gbk， linux默认编码方式是utf-8，mac：utf-8
# f1 = open('11.txt', mode='rb')
# content = f1.read()
# print(content)
# f1.close()
# b 模式无需定义编码,主要用于非文字类的文件操作，比如图片，视频
# r rb r+ r+b
# w wb w+ w+b
# a ab a+ a+b

三，文件读的几种模式

#1. read 全部读出来
# f1 = open('11.txt', mode='r', encoding='utf-8')
# print(f1.read())
# f1.close()

#1.1 read[n] 指定读取
# f1 = open('11.txt', mode='r',encoding='utf-8')
# print(f1.read(12))  #r模式是按照字符去读
# f1.close()

# f1 = open('11.txt', mode='rb')
# print(f1.read(16))  #rb模式是按照字节去读
# f1.close()

#2. readline 按行读取
'''
    def readline(self, limit=-1):
        """Read and return one line from the stream.

        :type limit: numbers.Integral
        :rtype: bytes
        """
        return b''
'''
# f1 = open('11.txt', mode='r',encoding='utf-8')
# print(f1.readline())
# print(f1.readline())
# f1.close()

#3. readlines
'''
    def readlines(self, hint=-1):
        """Read and return a list of lines from the stream.

        :type hint: numbers.Integral
        :rtype: list[unicode]
        """
        return []
'''

#4. for循环 最后读取大文件的方式，只占一行的内存
# f1  = open('11.txt', 'r', encoding='utf-8')
# for n in f1:
#     print(n)

read（3）：

　　1. 文件打开方式为文本模式时，代表读取3个字符

　　2. 文件打开方式为b模式时，代表读取3个字节

其余的文件内光标移动都是以字节为单位的如：seek，tell，truncate

注意：

　　1. seek有三种移动方式0，1，2，其中1和2必须在b模式下进行，但无论哪种模式，都是以bytes为单位移动的

　　2. truncate是截断文件，所以文件的打开方式必须可写，但是不能用w或w+等方式打开，因为那样直接清空文件了，所以truncate要在r+或a或a+等模式下测试效果。

# seek() tell()
# seek(0,2) 指针调到最后
# tell() 告诉指针位置
# f1 = open('11.txt', 'r', encoding='utf-8')
# f1.seek(0,2)
# print(f1.read())

四、文件的修改

文件的数据是存放于硬盘上的，因而只存在覆盖、不存在修改这么一说，

方式一：将硬盘存放的该文件的内容全部加载到内存，在内存中是可以修改的

方式二：将硬盘存放的该文件的内容一行一行地读入内存，修改完毕就写入新文件

#1. 打开文件产生文件句柄
#2. 创建新文件产生文件句柄
#3. 读取源文件，进行修改，写入新文件
#4. 将源文件删除
#5. 将文件命名源文件

import os
# low版
# with open('11.txt', 'r', encoding='utf-8') as f1,
#     open('11.bak', 'w', encoding='utf-8') as f2:
#     old_content = f1.read()
#     new_content = old_content.replace('我爱你', '我擦了')
#     f2.write(new_content)
# os.remove('11.txt')
# os.rename('11.bak', '11.txt')

#for循环版
# with open('11.txt', 'r', encoding='utf-8') as f1,
#     open('11.bak', 'w', encoding='utf-8') as f2:
#     for line in f1:
#         new_content = line.replace('我擦了', '我爱你')
#         f2.write(new_content)
# os.remove('11.txt')
# os.rename('11.bak', '11.txt')

五、练习

1. 文件a.txt内容：每一行内容分别为商品名字，价钱，个数。

apple 10 3

tesla 100000 1

mac 3000 2

lenovo 30000 3

chicken 10 3

通过代码，将其构建成这种数据类型：[{'name':'apple','price':10,'amount':3},{'name':'tesla','price':1000000,'amount':1}......] 并计算出总价钱。

# l1 = []
# sum = 0
# with open('a.txt', 'r', encoding='utf-8') as f1:
#     for n in f1:
#         n = n.split()
#         if n:
#             sum += int(n[1]) * int(n[2])
#             l1.append({"name": n[0], "price": n[1], "amount": n[1]})
# print(sum)
# print(l1)

2，有如下文件：

-------

alex是老男孩python发起人，创建人。

alex其实是人妖。

谁说alex是sb？

你们真逗，alex再牛逼，也掩饰不住资深屌丝的气质。

----------

将文件中所有的alex都替换成大写的SB。