python-文件的基本操作

文件操作的三个步骤:

1,打开文件,得到文件句柄并赋值给一个变量

2.通过句柄对文件进行操作

3.关闭文件

一、打开关闭文件

必须先用Python内置的open()函数打开一个文件,创建一个file对象,相关的方法才可以调用它进行读写

f = open('a.txt', mode='rt',encoding='utf-8')
f.close()

f.close()是向操作系统发送请求,要求操作系统关闭打开的文件,文件打开后,一定要在程序结束前关闭!

with语句:为了防止忘记关闭文件,Python的上下文管理with语句可以很方便的使用

with open('a.txt', mode='rt', encoding='utf-8') as f:
    pass
# 打开多个文件
with open('a.txt', mode='rt', encoding='utf-8') as f,open('b.txt', mode='rt', encoding='utf-8')as f1:
    pass    

二、文件基本操作

  • r:只读模式,     默认模式,文件必须存在不存在则抛出异常
  • w:只写模式,    不可读,文件不存在则创建,存在则清空内容
  • a:追加模式,     可读,可写,文件不存在则创建,存在则在最后一行追加内容

用"+"可以表示同时读写某个文件

  • r+   可读可写
  • w+  可读可写  消除文件内容,然后以写读的方式打开文件
  • a+   可读可写  以读写方式打开文件,并把文件指针移到文件尾  

注意:r默认打开的是text格式,rb,wb,ab读取到的内容都是byte字节,写入时也要提供字节类型,后面的字符编码不能添加.

with open('a.txt', mode='rb',) as f:
    a = f.read()
    print(a)  #输出为二进制b'xe6xafx8fxe5xa4xa9xe9x83xbdxe5xadxa6xe4xb9xa0'
    print(a.decode())#每天都学习

rb模式每次读取一个字节,rt模式每次读取的是一个字符串

with open('a.txt', mode='rb',) as f:
    a = f.read(3)
    print(a)#b'xe6xafx8f'
with open('a.txt', mode='rt',encoding='utf-8') as f:
    print(f.read(2))#每天
with open('a.txt', mode='rt',encoding='utf-8') as f:
    print(f.read(2))#每天 读取前面两个字符串
with open('a.txt', mode='rt',encoding='utf-8') as f:
    print(f.read())全部读取
with open('a.txt', mode='rt',encoding='utf-8') as f:
    print(f.readline())#每次读取一行 
    print(f.readline())
with open('a.txt', mode='rt',encoding='utf-8') as f:
    print(f.readlines())#将读出来的内容存在一个列表中
    print(f.readable())#是否可读
with open('b.txt', mode='wb') as f:
    f.write('abc你好'.encode('utf-8')) #写入内容至b.txt
    # a = ["菜鸟教程 1
", "菜鸟教程 2"]
    # f.writelines(a)# 将列表写入,字节情况下无法写入
    print(f.readable())# Fales
    print(f.writable())# True
with open('b.txt', mode='a', encoding='utf-8') as f:
    print(f.tell())#鼠标指针当前位置
    f.write('qwe')# 在文件内容后面添加'qwe'
    print(f.tell())#鼠标指针当前位置

控制指针移动:

f.seek(offset,whence)

offset:代表控制指针移动的字节数

whence:代表参照什么位置移动 

  • whence =0:参照文件开头 特殊:可以在t和b模式下使用
  • whence =1:参照当前所在位置,必须在b模式下使用
  • whence =2:参照文件末尾,必须在b模式下使用
# with open('a.txt', mode='rt', encoding='utf-8') as f:
#     f.seek(6, 0)#移动的是字节数,三个字节为一个汉字
#     msg = f.read(1)
#     print(msg)


# with open('a.txt', mode='rb') as f:
#     f.seek(3, 1)
#     msg = f.read(6)
#     msg = f.read(5)#报错,因为汉字为三个字节
#     print(msg.decode('utf-8'))


#参照末尾
with open('a.txt', mode='rb') as f:
    f.seek(-3, 2)
    print(f.tell())
    msg = f.read(3)
    print(msg.decode('utf-8'))

三、文件修改

方式一:

将文件内容由硬盘全部读入内存,在内存中完成修改,将内存中修改的结果覆盖写会硬盘

with open('a.txt',mode='rt', encoding='utf-8') as f:
    all_data = f.read()
all_data = all_data.replace('','zfj')
with open('a.txt', mode='wt', encoding='utf-8') as f:
    f.write(all_data)

方式二:

1.以读的方式打开源文件,以写的方式打开一个临时文件

2.从源文件中每读一行内容,修改完毕后写入临时文件,直到源文件读取完毕

3.删掉源文件,将临时文件重命名为源文件

import os
with open('a.txt', mode='rt', encoding='utf-8') as f,open('a_swap.txt',mode='wt', encoding='utf-8')as f1:
    for i in f:
        f1.write(i.replace('哎呀呀','zfj'))
os.remove('a.txt')
os.rename('a_swap.txt', 'a.txt')

总结:

方式一:在文件修改过程中硬盘上始终一份数据,内存占用过多,不适用于大文件

方式二:在同一时刻内存中只存放源文件一行内容,不会占用过多内存,缺点是在文件修改过程中硬盘同时存在两份数据

每天都要学习!

 

焚膏油以继晷,恒兀兀以穷年。
原文地址:https://www.cnblogs.com/mangM/p/9378793.html