文件处理

 一、文件与文件的模式

1、什是文件

文件是操作系统提供给用户/应用程序操作硬盘的一种虚拟的概念/接口。
    用户/应用程序(open())
    操作系统(文件)
    计算机硬件(硬盘)
2、为何要用文件
(1)应用程序运行过程中产生的数据最先都是存放于内存中的,用户/应用程序可以通过文件将数据永久保存的硬盘中。
    即操作文件就是操作硬盘。
(2)应用程序若想操作硬件必须通过操作系统,用户/应用程序直接操作的是文件(文件就是操作系统提供给应用程序来操作硬盘的虚拟概念),对文件进行的所有的操作,都是在向操作系统发送系统调用,然后由操作系统完成对硬盘的具体操作。
3、如何用文件:open()
 1)控制文件读写内容的模式:t和b
 强调:t和b不能单独使用,必须跟r/w/a连用
  * t文本(默认的模式):
        1、读写都以str(unicode)为单位的
        2、文本文件
        3、必须指定encoding='utf-8'
  * b二进制/bytes

2控制文件读写操作的模式
Ⅰ.r只读模式:在文件不存在时则报错,文件存在文件内指针直接跳到文件开头,可用于系统登录功能。

Ⅱ.w只写模式:在文件不存在时会创建空文档,文件存在会清空文件,文件指针跑到文件开头。可用于文本文件的复制。

# 在文件不关闭的情况下,连续的写入,后写的内容一定跟在前写内容的后面。

# 如果重新以w模式打开文件,则会清空文件内容。

Ⅲ.a只追加写模式:在文件不存在时会创建空文档,文件存在会将文件指针直接移动到文件末尾。可用于注册账号功能。

#强调 w 模式与 a 模式的异同:

#相同点:在打开的文件不关闭的情况下,连续的写入,新写的内容总会跟在前写的内容之后。

#不同点:以 a 模式重新打开文件,不会清空原文件内容,会将文件指针直接移动到文件末尾,新写的内容永远写在最后。
Ⅳ.+:r+、w+、a+   # 可读可写 

二、文件操作

1、打开文件

# windows路径分隔符问题 open('C:a.txt bcd.txt')

# 解决方案一:推荐r

# open(r'C:a.txt bcd.txt')

# 解决方案二:斜杠/

# open('C:/a.txt/nb/c/d.txt')

f=open(r'aaa/a.txt',mode='rt') # f的值是一种变量,占用的是应用程序的内存空间

 2、操作文件:读/写文件,应用程序对文件的读写请求都是在向操作系统发送系统调用,然后由操作系统控制硬盘把输入读入内存、或者写入硬盘。

res=f.read()

3、关闭文件

文件。在操作完毕一个文件时,必须把与该文件的这两部分资源全部回收,回收方法为:

f.close() # 回收操作系统资源

del f     # 回收应用程序资源

del f一定要发生在f.close()之后,否则就会导致操作系统打开的文件无法关闭,白白占用资源,而python自动的垃圾回收机制决定了我们无需考虑del f,这就要求我们,在操作完毕文件后,一定要记住f.close()。

三、with上下文管理

1、在执行完子代码块后,with 会自动执行f.close()

with open('a.txt','w') as f:

    pass

2、可用用with同时打开多个文件,用逗号分隔开即可with open('a.txt','r') as read_f,open('b.txt','w') as write_f:  

    data = read_f.read()

    write_f.write(data)

四、指定文件的操作编码

f = open(...)是由操作系统打开文件

如果打开的是文本文件,会涉及到字符编码问题,如果没有为open指定编码,操作系统会用自己的默认编码去打开文件,在windows下是GBK,在linux下是utf-8。若要保证不乱码,文件以什么方式存的,就要以什么方式打开。

例:f = open('a.txt','r',encoding='utf-8')

原文地址:https://www.cnblogs.com/python-htl/p/12487325.html