一、文件的处理:
1、文件操作:
1 #1. 打开文件,得到文件句柄并赋值给一个变量 2 f=open('a.txt','r',encoding='utf-8') #默认打开模式就为r 3 4 #2. 通过句柄对文件进行操作 5 data=f.read() 6 7 #3. 关闭文件 8 f.close()
2、打开文件的模式:
1 #1. 打开文件的模式有(默认为文本模式): 2 r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】 3 w,只写模式【不可读;不存在则创建;存在则清空内容】 4 a, 之追加写模式【不可读;不存在则创建;存在则只追加内容】 5 6 #2. 对于非文本文件,我们只能使用b模式,"b"表示以字节的方式操作(而所有文件也都是以字节的形式存储的,使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式) 7 rb 8 wb 9 ab 10 注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码 11 12 #3. 了解部分 13 "+" 表示可以同时读写某个文件 14 r+, 读写【可读,可写】 15 w+,写读【可读,可写】 16 a+, 写读【可读,可写】 17 18 19 x, 只写模式【不可读;不存在则创建,存在则报错】 20 x+ ,写读【可读,可写】 21 xb
3、操作文件的方法:
1 #掌握 2 f.read() #读取所有内容,光标移动到文件末尾 3 f.readline() #读取一行内容,光标移动到第二行首部 4 f.readlines() #读取每一行内容,存放于列表中 5 6 f.write('1111 222 ') #针对文本模式的写,需要自己写换行符 7 f.write('1111 222 '.encode('utf-8')) #针对b模式的写,需要自己写换行符 8 f.writelines(['333 ','444 ']) #文件模式 9 f.writelines([bytes('333 ',encoding='utf-8'),'444 '.encode('utf-8')]) #b模式 10 11 #了解 12 f.readable() #文件是否可读 13 f.writable() #文件是否可读 14 f.closed #文件是否关闭 15 f.encoding #如果文件打开模式为b,则没有该属性 16 f.flush() #立刻将文件内容从内存刷到硬盘 17 f.name
4、文件内光标移动:
: read(3):
1. 文件打开方式为文本模式时,代表读取3个字符
2. 文件打开方式为b模式时,代表读取3个字节
: 其余的文件内光标移动都是以字节为单位如seek,tell,truncate
注意:
. seek有三种移动方式0,1,2,其中1和2必须在b模式下进行,但无论哪种模式,都是以bytes为单位移动的
. truncate是截断文件,所以文件的打开方式必须可写,但是不能用w或w+等方式打开,因为那样直接清空文件了,所以truncate要在r+或a或a+等模式下测试效果
5、文件的修改:
文件的数据是存放于硬盘上的,因而只存在覆盖、不存在修改这么一说,我们平时看到的修改文件,都是模拟出来的效果,具体的说有两种实现方式:
方式一:将硬盘存放的该文件的内容全部加载到内存,在内存中是可以修改的,修改完毕后,再由内存覆盖到硬盘(word,vim,nodpad++等编辑器)
1 import os 2 3 with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f: 4 data=read_f.read() #全部读入内存,如果文件很大,会很卡 5 data=data.replace('alex','SB') #在内存中完成修改 6 7 write_f.write(data) #一次性写入新文件 8 9 os.remove('a.txt') 10 os.rename('.a.txt.swap','a.txt')
二、文件处理常用的内置函数
eval()函数,将字符串转换成集合或者字典,需要注意的是如果文件中每行最后有逗号,eval()之后将会变成集合
split()函数返回的是一个列表例如 '1,2,3,4,5 ' split(',')
map()函数 函数返回的是一个迭代器,要想转成列表list(map()),作用是将原有序列进行处理得到一个新的列表
filter()函数 是对序列进行筛选,去除不想要的数据
reduce()函数 将序列内数据和并压缩成一个新的数据
max()函数
min()函数
zip()函数
1 people = [ 2 {'name':'alex','age':18}, 3 {'name':'wupeiqi','age':28}, 4 {'name':'yuanhao','age':38}, 5 {'name':'linhaifeng','age':48} 6 ] 7 age_dict = {'age1':18,'age2':28,'age3':38,'age4':48} 8 ls = [1,34,6765,325,6,245,6,7] 9 print(max(age_dict.values())) 10 print(max(age_dict))#默认比较keys,字典for循环循环的是keys,字符串的比较是根据ascii表 11 print(max(zip(age_dict.values(),age_dict.keys()))) 12 print(list(max(zip(age_dict.values(),age_dict.keys())))) 13 print(max(ls)) 14 print('shuizuidai%s'%max(people,key=lambda dic:dic['age']))