文件处理

一、文件处理:

1、什么是文件:

文件是操作系统为应用程序和用户提供操作硬盘的一种虚拟单位

强调:

        文件是操作系统提供的虚拟单位

        应用程序或用户对文件的读写操作都是向操作系统发送指令

2、为何要用文件:

文件对应的硬盘空间,如果考虑需要永久保存数据那必须使用文件

3、如何用文件

路径问题

        绝对路径:

               win:C:acd.txt

               linux:/a/b/c/d.txt

        相对路径:相对于当前执行文件的所在的文件夹

               acd.txt

(1)打开文件:

例:f=open(r'D:脱产5期内容day09a.txt',mode='rt',encoding='utf-8')
print(f)

(2)读/写文件

data=f.read()
print(data)

(3)关闭文件

f.close()#向操作系统发送指令,让操作系统关闭打开的文件,回收操作资源
print(f)
f.read

上下文管理

with open('a.txt',mode='rt',encoding='utf-8') as f:
    data=f.read()
    print(data)

二、文件的打开模式

1、基本介绍

控制文件读写操作的模式

r(默认)

w

a

控制文件读写内容的模式(不能单独使用必须与r、w、a同时使用)

t(默认)

d

2、详细介绍

控制文件读写操作的模式

r(默认)只读模式,当文件不存在是则报错,当文件存在是文件指针在文件开头

例:with open('a.txt',mode='rt',encoding='utf-8') as f:
    data=f.read()
    print(f.readable())
    print(f.writable())   
line=f.readline()
# print(line,end='')
#
# line = f.readline()
# print(line,end='')
#
# print('第三次读')
# line = f.readline()
# print(line, end='')
# print(data,type(data))

# for line in f:
# print(line)

# print(f.readlines())
# pass


w 只写模式,以该模式打开文件当文件不存在时创建一个新的文件,当文件存在时清空文件内容,文件指针在文件开头

with open('a.txt',mode='wt',encoding='utf-8') as f:
    print(f.readable())
    print(f.writable())

    在打开了文件不关闭的情况下,连续的写入,新写的内容总是跟在老内容之后
    f.write('你瞅啥
')
    f.write('瞅你那熊样
')
    f.write('巴拉巴拉。。。
')

    lines=['1111
','2222
','3333
']
    for line in lines:
        f.write(line)
    f.writelines(lines)

    f.write('aaaa
bbb
cccc
')

a 只追加写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时不清空文件内容,文件指针跳至文件末尾

with open('c.txt',mode='at',encoding='utf-8') as f:
    f.write('你好阿斯蒂芬
')
    f.write('adfasdf
')

    f.writelines([1,2,3])

控制文件读写内容的模式(不能单独使用必须与r、w、a同时使用)

t(默认)无论读写都以字符为单位的,只能操作文本文件必须指定encoding参数

d 无论读写都以bytes为单位的,可以操作所有文件,一定不能指定encoding参数

with open('a.txt',mode='rb') as f:
    data=f.read()
    print(data,type(data))
    print(data.decode('utf-8'))

with open('01.mp4',mode='rb') as f:
    data=f.read()
    print(data,type(data))



with open('a.txt',mode='wb') as f:
    f.write('字符行啊士大夫阿斯蒂芬撒旦发'.encode('utf-8'))

练习:拷贝文件小程序

with open('01.mp4',mode='rb',) as read_f,
        open(r'D:1111.mp4',mode='wb') as write_f:
    data=read_f.read()
    write_f.write(data)


了解:
+:不能单独使用,必须与rwa连用,r+ w+ a+
with open('a.txt','r+t',encoding='utf-8') as f:
    # print(f.readable())
    # print(f.writable())

    data=f.readline()
    print(data)
    f.write('刘清蒸')

with open('a.txt','r+t',encoding='utf-8') as f:
# print(f.readable())
# print(f.writable())

f.seek(10)
  # print(f.tell())
f.write('你好啊')

三、文件修改的两种方式

1、方式一

1、以读的方式打开源文件

2、将文件内容一次性读入内存

3、以写的方式打开源文件,然后将写好的源文件次性写入源文件

总结

优点:在文件修改过程中硬盘只存一份数据

缺点:浪费内存

with open('b.txt',mode='rt',encoding='utf-8') as f1:
    msg=f1.read()
    new_msg=msg.replace('alex','大SB')


with open('b.txt',mode='wt',encoding='utf-8') as f2:
    f2.write(new_msg)

方式二

1、以读的方式打开源文件,以写的方式打开一个临时文件

2、读取源文件的内容到内存中,将修改的结果写入临时文件,循环往复直到改完

3、删除源文件,将临时文件重命名为源文件名

优点:同一时间内内存中只有一份文件的一行内容,更节省内存

缺点:在文件修改过程中硬盘中存在两份数据

import os

with open('b.txt',mode='rt',encoding='utf-8') as read_f,
    open('.b.txt.swap',mode='wt',encoding='utf-8') as write_f:
    for line in read_f:
        write_f.write(line.replace('大SB','alex'))


os.remove('b.txt')
os.rename('.b.txt.swap','b.txt')

 四、控制文件内鼠标的移动

强调:只有t模式下read(n),n代表字符个数,其他的都是以字节为单位

with open('a.txt',mode='rt',encoding='utf-8') as f:
    res=f.read(4)
    print(res)

with open('a.txt',mode='rb') as f:
    res=f.read(3)
    print(res.decode('utf-8'))

with open('a.txt',mode='at',encoding='utf-8') as f:
    f.truncate(3)

f.seek():指针移动是靠字节为单位的

三种模式,只有0模式既可以在t下用也可以在b模式下用,而1、2两种模式只能在b模式向用

0(默认的)的参照文件开头

with open('a.txt',mode='rt',encoding='utf-8') as f:
    f.seek(3,0)
    print(f.tell())
    print(f.read())

1             参照指针当前所在的位置  

with open('a.txt',mode='rb') as f:
    f.read(2)
    f.seek(4,1)
    print(f.tell())
    print(f.read().decode('utf-8'))

2              参照文件末尾

with open('a.txt',mode='rb') as f:
    f.seek(-5,2)
    print(f.tell())
    print(f.read().decode('utf-8'))
import time

with open('access.log',mode='rb') as f:
    f.seek(0,2)
    while True:
        line=f.readline()
        if len(line) == 0:
            time.sleep(0.1)
        else:
            print(line.decode('utf-8'),end='')
原文地址:https://www.cnblogs.com/liushen1995/p/10020205.html