巨蟒python全栈开发-第8天 文件操作

一.文件操作

今日大纲:

1.文件操作->open()
open 打开
f=open(文件路径,mode='模式',encoding='编码格式')
#python最最底层操作的就是bytes
打开一个文件的时候获取到的是一个文件句柄(#相当于插了一根管子)

绝对路径
从磁盘根目录开始寻找
相对路径
相对于当前程序所在的文件夹
../上一层文件
文件夹/进入xxx文件夹
2.mode:
高频: r r+ rb
w wb
a
了解: w+ a+ ab
r+b w+b a=b
(1)r:读取,只读,读取文件的相关操作
1.read()
默认:读取全部文件内容
read(n) 读取n个字符
2.readline() 读取一行内容
3.readlines() 读取全部内容,返回列表
4.for line in f:每次读取一行内容:(最重要的)
(注意在这里打印出来的有一个空行,需要strip()去掉空行)

(2)w:写入:写文件的相关操作
1.写入,只写
2.创建文件
3.会清空文件
(3)a:追加
1.也可以创建文件
2.追加写
(4)r+:
1.对于文件而言,应该有的操作就两个:读,写
2.读写操作
(5)w+:写读操作
(6)a+:追加写读
(7)所有带b的表示直接操作的是bytes,当处理非文本文件的时候
例如:rb/wb
ab:断点续传//别人写好来了专门的库,可以直接用
r+b w+b a+b
3.文件操作中关于文件句柄的相关操作
(1)seek() 移动光标
seek详解:
f.seek(0) 移动到开头(最多)
f.seek(0,2) 移动到结尾,seek的第二个参数表示的是从哪个位置进行偏移
默认是0,表示开头,1表示当前位置,2表示结尾
seek:两个参数
1.表示偏移量
2.从xxx开始偏移,默认0,开头位置 1 当前位置 2 末尾位置

f.seek(10,1) #从当前位置走10步
f.seek(10,2) #从末尾位置走10步

(2)tell:返回光标所在的位置
(3)seek/tell/truncate,这三个方法的参数,都是字节的
4.实际操作,文件修改(重点)
#python是最终是以字节形式操作文件的

DAY8-文件操作

本节主要内容:

(1)r模式初识
(2)文件路径的问题
(3)r模式
(4)w模式
(5)a模式
(6)+模式
(7)文件复制bytes rb/wb模式
(8)seek和tell
(9)文件修改
(10)水果统计


内容详解:
(1)r模式初识    r:read 只读
文件里的内容:alex周杰伦昆凌周润发
f=open('小护士模特主妇萝莉',mode='r',encoding='utf-8')
#读取内容
content=f.read()#全部都读取出来(最后光标就在末尾了)
print(content)

#坑:
c2=f.read()  #注意:第二次读取,读取不到内容,因为上面已经读取完毕,光标在末尾
print('c2',c2)  #结果显示的是第一个c2,第二个c2已经没有东西可读了

#良好的习惯
f.close()   #关闭连接

#结果:alex周杰伦昆凌周润发
#       c2     

主要:f.close()的位置

(2)文件路径的问题
文件路径:
1.相对路径:相对于当前程序所在的文件夹,如果在文件夹内,随便找,直接写名字
如果不在这个文件夹内容,可能需要 出文件夹或者进文件夹
出文件夹 ../
进文件夹 文件夹/

对上图进行解释:金庸是根目录,它的子目录包括:天龙八部,射雕,金庸大杂烩.py

      天龙八部下面的文件是:乔峰                              

      射雕下面的文件是:九阴真经,洪七公,郭靖

      九阴真经下面的文件是:梅超风.py

对于同一根文件"金庸"下的,''金庸大杂烩.py'',我们,直接找并列的,兄弟文件就行

f = open("天龙八部/乔峰", mode="r", encoding="utf-8")
content = f.read()
print(content)

f = open("射雕/郭靖", mode="r", encoding="utf-8")
content = f.read()
print(content)

对于同一根文件'金庸'下的 '梅超风.py',找乔峰文件,按照上边的思维是应该按照上边的写法!!!!!!!

f = open("九阴真经/射雕/天龙八部/乔峰", mode="r", encoding="utf-8")
print(f.read())
f.close()

但是上边的写法是错误的,我们应该把往上层走的文件用../表示,所以应该是下面写法,并列走,不能替换,往下走也不能替换

f = open("../../天龙八部/乔峰", mode="r", encoding="utf-8")
print(f.read())
f.close()

同理,'洪七公.py'找'乔峰',应该往上走一层,再找兄弟,再往下走

f = open("../天龙八部/乔峰")

2.绝对路径:从磁盘根目录寻找路径(有问题)
只有在记录日志的时候可以用到绝对路径
日志:程序运行过程中记录的信息 (尤其是游戏公司)

 绝对路径案例:

f=open('F:spython西游记金角大王.txt',mode='r',encoding='gbk')
print(f.read())
f.close()

 在windows10中,txt文件直接写的中文是gbk,所以写的是gbk,直接用gbk解码

 (3)r模式

1.文件内容:alex周杰伦昆凌周润发
f=open('小护士模特主妇萝莉',mode='r',encoding='utf-8')
print(f.read()) #alex周杰伦昆凌周润发
f.close()
2.
f=open('小护士模特主妇萝莉',mode='r',encoding='utf-8')
print(f.read(5)) #读取5个字符   #结果:alex周
print(f.read(5)) #继续读取5个字符 #结果:杰伦昆凌周
f.close()

3.
f=open('小护士模特主妇萝莉',mode='r',encoding='utf-8')
print('xxxxx ',end='') #结果:xxxxx # 代表换行
print(f.readline()) #读一行: alex周杰伦昆凌周润发

结果:xxxxx
   alex
4.文件内的 打印出来的还是

5.最好用的方式,没有之一
#文件句柄是一个可迭代对象

f=open('小护士模特主妇萝莉',mode='r',encoding='utf-8')
for line in f: #从文件
print(line.strip())
# print(line)

6. print(f.readline().strip()) # 换行符为分割, strip()可以去掉换行. 读取到的内容第一件事就是去掉空白
  print(f.readline()) # 换行符为分割

7.
print("周润发", end="胡辣汤")
print("周润发")
结果:周润发胡辣汤周润发

8.print(f.readlines()) # 一次性把文件中的内容读取到列表中.
9.
print("你叫什么名字?
 我叫李嘉诚. 可能") #  换行
print("你叫什么名字?\n 我叫李嘉诚. 可能") # 显示
print("你叫什么名字?\\n 我叫李嘉诚. 可能") # 显示 \n
结果:

  你叫什么名字?
  我叫李嘉诚. 可能
  你叫什么名字? 我叫李嘉诚. 可能
  你叫什么名字?\n 我叫李嘉诚. 可能

(4)w模式
每次用w模式打开文件,都会清空这个文件(坑)
尤其是日志,不能用w模式写
f=open('胡辣汤',mode='w',encoding='utf-8')     #可以帮我们创建文件
f.write('河南特色
')   #写一行就换行
f.write('东北特色
')
f.write('陕西特色
')
#好习惯
f.flush()   #刷新管道,把数据写入文件
f.close()

(5)a模式

f=open('胡辣汤',mode='a',encoding='utf-8') #a,append 追加,在文件的末尾写入内容

  f.read() #报错 not readable

f.write('你叫什么名字啊?')
f.close()

(6)+模式

r+

f=open('葫芦小金刚',mode='r+',encoding='utf-8')
content=f.read()    #顺序必须先读,后写
#r+特有的深坑:不论读取内容的多少,只要你读了,写就是在末尾
f.write('五娃')
print(content)

w+

#w+一上来会清空文件. 没人用
f = open("葫芦小金刚", mode="w+", encoding="utf-8")
f.write("又能吐火的, 有能吐水的.")
# 移动光标
f.seek(0) # 移动到开头
s = f.read()
print("=========>", s)

a+

#a+追加写读,光标在末尾,所有的写都是在末尾
f=open('葫芦小金刚',mode='a+',encoding='utf-8')
f.write('丢丢丢,机器葫芦娃召唤神龙,高喊,我代表月亮消灭你!')
f.seek(0)
s=f.read()
print('===>',s)

(7)文件复制bytes 

#注意这个路径的写法,我困在这个地方很久,如果不加/,在当前目录下创建一个新的一模一样的图片,必须在pycharm的文件路径下才能删除

f1=open('d:/huyifei.jpg',mode='rb')
f2=open('f:/huyifei.jpg',mode='wb')
for line in f1:     #line是从f1中读取的内容     #里边会自己分行
    f2.write(line)  #把读取的内容原封不动的写出去
f1.close()
f2.flush()
f2.close()

(8)seek&tell

f = open("胡辣汤", mode="r+", encoding="utf-8")
# f.seek(0,2) # 移动到末尾
# content = f.read(5)
# print(content)
# f.seek(0) # 移动到开头
# print(f.read()) #读取全部内容
# print(f.tell())  # 字节

f.seek(3)
print(f.read())

tell和seek和truncate都是字节码个数

(9)文件修改:

文件内容:

alex是一个大好人
好人一生平安
好人是alex
你是一个好人

需求:把好人换成sb
必须做的事:
1.先从文件中读取内容
2.把要修改的内容进行修改
3.把修改好的内容写入一个新文件
4.删除掉原来的文件
5.把新文件重命名成原来的文件的名字
导入os模块//os模块表示操作系统

方法一:
#with会自动的帮我们关闭文件的链接
with open('夸一夸alex',mode='r',encoding='utf-8') as f,
    open('夸一夸alex_副本',mode='w',encoding='utf-8') as f1:
    for line in f:
        if 'sb' in line:
            line=line.replace('sb','好人')
        f1.write(line)
import os
import time

time.sleep(3)          #在删除程序之前,先让程序睡3s(程序暂停三秒)
os.remove('夸一夸alex')   #删除原来文件
time.sleep(3)           # 在pycharm中显示不明显,在原来的文件目录中可以明显观察到变化
os.rename('夸一夸alex_副本','夸一夸alex')  #重命名副本为原来的文件

方法二:

f=open('夸一夸alex',mode='r',encoding='utf-8')
f2=open('夸一夸alex_副本',mode='w',encoding='utf-8')

for line in f:
    if '好人'  in line:
        line=line.replace('好人','sb')
    f2.write(line)
f.close()
f2.flush()
f2.close()

import os
import time

time.sleep(3)          #在删除程序之前,先让程序睡3s(程序暂停三秒)
os.remove('夸一夸alex')   #删除原来文件
time.sleep(3)           # 在pycharm中显示不明显,在原来的文件目录中可以明显观察到变化
os.rename('夸一夸alex_副本','夸一夸alex')  #重命名副本为原来的文件

(10)水果统计

文档:

1,香蕉,1.85,50
2,苹果,2.6,100
3,榴莲,25,800
4,木瓜,3.5,1000
处理一:
f=open('水果.txt',mode='r',encoding='utf-8')
for line in f:          #1,香蕉,1.85,50
    dic={}              #每行都是一个字典
    line=line.strip()   #去掉空白 
 1,香蕉,1.85,50
    a,b,c,d=line.split(",")  #[1,香蕉,1.85,50]
    dic['id']=a
    dic['name']=b
    dic['price']=c
    dic['totle']=d
    print(dic)
# 结果:
# {'id': '1', 'name': '香蕉', 'price': '1.85', 'totle': '50'}
# {'id': '2', 'name': '苹果', 'price': '2.6', 'totle': '100'}
# {'id': '3', 'name': '榴莲', 'price': '25', 'totle': '800'}
# {'id': '4', 'name': '木瓜', 'price': '3.5', 'totle': '1000'}

处理二:

#把字典装到列表里
f=open('水果.txt',mode='r',encoding='utf-8')
lst=[]
for line in f:          #1,香蕉,1.85,50
    dic={}              #每行都是一个字典
    line=line.strip()   #去掉空白 
 1,香蕉,1.85,50
    a,b,c,d=line.split(",")  #[1,香蕉,1.85,50]   #解构
    dic['id']=a
    dic['name']=b
    dic['price']=c
    dic['totle']=d
    lst.append(dic)
print(lst)
#结果:
# [{'id': '1', 'name': '香蕉', 'price': '1.85', 'totle': '50'},
# {'id': '2', 'name': '苹果', 'price': '2.6', 'totle': '100'},
# {'id': '3', 'name': '榴莲', 'price': '25', 'totle': '800'},
# {'id': '4', 'name': '木瓜', 'price': '3.5', 'totle': '1000'}]

升级处理文档:

编号,名称,价格,重量
1,香蕉,1.85,50
2,苹果,2.6,100
3,榴莲,25,800
4,木瓜,3.5,1000
处理一:
f=open('水果.txt',mode='r',encoding='utf-8')
line=f.readline()   #第一行内容,编号,名称,价格,数量
h,i,j,k=line.split(',')
lst=[]
for line in f:          #1,香蕉,1.85,50
    dic={}              #每行都是一个字典
    line=line.strip()   #去掉空白 
 1,香蕉,1.85,50
    a,b,c,d=line.split(",")  #[1,香蕉,1.85,50]   #解构
    dic[h]=a
    dic[i]=b
    dic[j]=c
    dic[k]=d
    lst.append(dic)
print(lst)
#结果:#结果多了一个

# [{'编号': '1', '名称': '香蕉', '价格': '1.85', '重量
': '50'},
#  {'编号': '2', '名称': '苹果', '价格': '2.6', '重量
': '100'},
#  {'编号': '3', '名称': '榴莲', '价格': '25', '重量
': '800'},
#  {'编号': '4', '名称': '木瓜', '价格': '3.5', '重量
': '1000'}]

处理二:

#在第2行,添加 strip()
f=open('水果.txt',mode='r',encoding='utf-8')
line=f.readline().strip()   #第一行内容,编号,名称,价格,数量
h,i,j,k=line.split(',')
lst=[]
for line in f:          #1,香蕉,1.85,50
    dic={}              #每行都是一个字典
    line=line.strip()   #去掉空白 
 1,香蕉,1.85,50
    a,b,c,d=line.split(",")  #[1,香蕉,1.85,50]   #解构
    dic[h]=a
    dic[i]=b
    dic[j]=c
    dic[k]=d
    lst.append(dic)
print(lst)

# 结果
# [{'编号': '1', '名称': '香蕉', '价格': '1.85', '重量': '50'}, 
#  {'编号': '2', '名称': '苹果', '价格': '2.6', '重量': '100'}, 
#  {'编号': '3', '名称': '榴莲', '价格': '25', '重量': '800'}, 
#  {'编号': '4', '名称': '木瓜', '价格': '3.5', '重量': '1000'}]

处理三:最终版本,提升了程序的可扩展性

#推导步骤#将解包转化为列表,将分解完的,合成一个
f=open('水果.txt',mode='r',encoding='utf-8')
line=f.readline().strip()  #第一行的内容,   编号,名称,价格,重量,哈哈
title=line.split(',')                                       #title是一个列表  [编号,名称,价格,重量,哈哈]
lst=[]
# print(title)                                              #老师帮忙调试
for line in f:      #1,香蕉,1.85,50
    dic={}          #每一行都是一个字典
    line=line.strip()       #去掉空白  
 1,香蕉,1.85,50
    date=line.split(',')                                    #[1,香蕉,1.85,50]
    # print(date)                                           #老师帮忙调试
    for i in range(len(title)):
        #title[i]   &  date[i]
        dic[title[i]]=date[i]
    lst.append(dic)
print(lst)

# [{'编号': '1', '名称': '香蕉', '价格': '1.85', '重量': '50'},
# {'编号': '2', '名称': '苹果', '价格': '2.6', '重量': '100'},
# {'编号': '3', '名称': '榴莲', '价格': '25', '重量': '800'},
# {'编号': '4', '名称': '木瓜', '价格': '3.5', '重量': '1000'}]

Day08今日作业:

1,有如下文件,a1.txt,里面的内容为:

老男孩是最好的培训机构,
全心全意为学生服务,
只为学生未来,不为牟利。
我说的都是真的。哈哈

分别完成以下的功能:

a,将原文件全部读出来并打印。
with open('a1.txt',mode='r',encoding='utf-8') as f:
    ff=f.read()
    print(ff)
b,在原文件后面追加一行内容:信不信由你,反正我信了。
with open('a1.txt',mode='a',encoding='utf-8') as f:
    ff=f.write('
信不信由你,反正我信了。')
c,将原文件全部读出来,并在后面添加一行内容:信不信由你,反正我信了。
with open('a1.txt',mode='r+',encoding='utf-8')as f:
    fk=f.read()
    print(fk)
    ff=f.write('
信不信由你,反正我信了。')
d,将原文件全部清空,换成下面的内容:

每天坚持一点,
每天努力一点,
每天多思考一点,
慢慢你会发现,
你的进步越来越大。
with open('a1.txt',mode='w',encoding='utf-8')as f:
    ff=f.write('每天坚持一点,'
               '
每天努力一点,'
               '
每天多思考一点,'
               '
慢慢你会发现,'
               '
你的进步越来越大。')
e,将原文件内容全部读取出来,并在‘我说的都是真的。哈哈’这一行的前面加一行,
‘你们就信吧~’然后将更改之后的新内容,写入到一个新文件:a1.txt。
重点题目!!!
import os
with open('a1.txt',mode='r+',encoding='utf-8')as f ,
    open('a.txt',mode='w',encoding='utf-8')as f2:
    for line in f:
        f2.write(line.replace('我说的都是真的。哈哈','你们就信吧~,
我说的都是真的。哈哈'))
os.remove('a1.txt')
os.rename('a.txt','a1.txt')

2,有如下文件,t1.txt,里面的内容为:

葫芦娃,葫芦娃,
一根藤上七个瓜
风吹雨打,都不怕,
啦啦啦啦。
我可以算命,而且算的特别准:
上面的内容你肯定是心里默唱出来的,对不对?哈哈

分别完成下面的功能:

a,以r+的模式打开原文件,判断原文件是否可读,是否可写。
重点:上课没有讲过的方法
with open('t1.txt',mode='r+',encoding='utf-8') as f:
        print(f.writable())
        print(f.readable())
b,以r的模式打开原文件,利用for循环遍历文件句柄。
with open('t1.txt',mode='r',encoding='utf-8') as f:
    for i in f:
        print(i.strip())    #(1)
        print(i,end='')   #(2)

上边(1)和(2)的作用是一样的,strip()和end=''的目的都是去除换行


c,以r的模式打开原文件,以readlines()方法读取出来,并循环遍历
readlines(),并分析b,与c 有什么区别?深入理解文件句柄与readlines()结果的区别。
with open('t1.txt',mode='r',encoding='utf-8') as f:
    ff=f.readlines()
    # print(ff)
    for i in ff:
        print(i.strip())
  b是直接遍历句柄,读出来,
  c是先用readlines把文件内的信息放到列表中,相当于我们再遍历列表中的信息
d,以r模式读取‘葫芦娃’前三个字符。
with open('t1.txt',mode='r',encoding='utf-8') as f:
    s=f.read(3)
    print(s)
e,以r模式读取第一行内容,并去除此行前后的空格,制表符,换行符。(换行符是
,制表符是	(tab).
)
with open('t1.txt',mode='r',encoding='utf-8') as f:
    # k=f.readline().strip()      #测试(1)  
    k=f.readline()                   #测试(2)
    print(k)
       
#测试的结果中(1)和(2)的结果是一样的

f,以r模式打开文件,从‘风吹雨打.....’开始读取,一直读到最后。
with open('t1.txt',mode='r',encoding='utf-8') as f:
    for i in f:
        if i.startswith('风吹雨打'):  #如果开头是"风吹雨打
            # print(i,end='')           #(1)把后边的换行去掉
            # print(i)           #中间会空一行,应该把后边的换行去掉
            print(i.strip())           #(2)把后边的换行去掉   ,注意(1)和(2)的效果一样
            print(f.read())            #从风吹雨打这一行最末尾,开始读剩下的信息
g,以a+模式打开文件,先追加一行:‘老男孩教育’然后在从最开始将原内容全部读取出来。
with open('t1.txt',mode='a+',encoding='utf-8') as f:
    f.write('
老男孩教育')
    f.seek(0)
    ff=f.read()
    print(ff)
h,截断原文件,留下内容:‘葫芦娃’
#方法一:
with open('t1.txt',mode='a+',encoding='utf-8') as f:
    f.truncate(9)  #注意这里的truncate是字节码的个数
    f.seek((0))
    print(f.read())
#方法二:
with open('t1.txt',mode='a+',encoding='utf-8') as f:
    f.seek(9)
    f.truncate()
    f.seek(0)
    print(f.read())
3.文件a.txt内容:每一行内容分别为商品名字,价钱,个数。

apple 10 3
tesla 100000 1
mac 3000 2
lenovo 30000 3
chicken 10 3

通过代码,将其构建成这种数据类型:
[{'name':'apple','price':10,'amount':3},{'name':'tesla','price':1000000,'amount':1}......]
并计算出总价钱。

with open('a.txt',mode='r',encoding='utf-8') as f:
    lst=[]
    for i in f:
        dic = {}
        s=i.split()
        # print(s)
        dic['name']=s[0]
        dic['price']=s[1]
        dic['amount']=s[2]
        lst.append(dic)
        # print(dic)
print(lst)
sum=0
for k in lst:
    sum+=int(k['price'])*int(k['amount'])
print(sum)
4,有如下文件:

alex是老男孩python发起人,创建人。
alex其实是人妖。
谁说alex是sb?
你们真逗,alex再牛逼,也掩饰不住资深屌丝的气质。

将文件中所有的alex都替换成大写的SB(文件的改的操作)。
with open('pythonalex',mode='r',encoding='utf-8') as f,
    open('pythonalex_911',mode='w',encoding='utf-8')as f1:
    for i in f:
        if 'alex' in i:
            i=i.replace('alex','SB')    #这个地方必须用等于
        f1.write(i)
import os
os.remove('pythonalex')
os.rename('pythonalex_911','pythonalex')
5,文件a1.txt内容(升级题)

name:apple price:10 amount:3 year:2012
name:tesla price:100000 amount:1 year:2013
.......

通过代码,将其构建成这种数据类型:
[{'name':'apple','price':10,'amount':3},
{'name':'tesla','price':1000000,'amount':1}......]
并计算出总价钱。
#我把文件名改成了b1
with open('b1',mode='r',encoding='utf-8') as f:
    lst=[]
    for i in f:
        dic={}
        s=i.split()    #字符串切割成列表:[name:apple,price:10,amount:3,year:2012]
        for k in s:
            l=k.split(':')   #[name,apple]
            dic[l[0]]=l[1]
        dic.pop('year')
        lst.append(dic)
    print(lst)
    sum=0
    for z in lst:
        sum+=int(z['price'])*int(z['amount'])
    print(sum)
6,文件a1.txt内容(升级题)

序号 部门 人数 平均年龄 备注
1 python 30 26 单身狗
2 Linux 26 30 没对象
3 运营部 20 24 女生多
.......

通过代码,将其构建成这种数据类型:
[{'序号':'1','部门':Python,'人数':30,'平均年龄':26,'备注':'单身狗'},......]
with open('c1.txt',mode='r+',encoding='utf-8') as f:
    # ff=f.readline().strip()
    ff=f.readline()
    s=ff.split()        #列表:[序号,部门,人数,平均年龄,备注]
    # print(s)
    # f3=f.read()
    # print(f3)
    # print(s)
    li=[]
    for i in f:         #i是:   1       python    30         26         单身狗
        dic={}
        # print(i.strip())
        i=i.strip()
        ii=i.split()
        for z in range(len(s)):
            dic[s[z]]=ii[z]         #重点注意:在这里分割的是用ii,不是li,在这个地方纠结了好长时间
        li.append(dic)
print(li)

明日默写:
就是第4题的代码(课上讲过)。

原文地址:https://www.cnblogs.com/studybrother/p/10069386.html