数据处理

文件读写操作

1.打开文件

file_object = open(file_name, access_mode = 'r', buffering = -1, encoding = None)
功能:打开一个文件,返回一个文件对象。
参数:file_name 文件名
        access_mode  打开文件的方式,如果不写默认为‘r’
        buffering   1表示有行缓冲,默认则表示使用系统默认提供的缓冲机制
        encoding = 'UTF-8'  设置打开文件的编码方式,一般Linux下不需要

2.读取文件

read([size])
功能: 来直接读取文件中字符。
参数: 如果没有给定size参数(默认值为-1)或者size值为负,文件将被读取直至末尾,给定size最多读取给定数目个字符(字节)。
返回值: 返回读取到的内容

注意:文件过大时候不建议直接读取到文件结尾,读到文件结尾会返回空字符串。

readline([size])
功能: 用来读取文件中一行
参数: 如果没有给定size参数(默认值为-1)或者size值为负,表示读取一行,给定size表示最多读取制定的字符(字节)。
返回值: 返回读取到的内容
readlines([sizeint])
功能: 读取文件中的每一行作为列表中的一项
参数: 如果没有给定size参数(默认值为-1)或者size值为负,文件将被读取直至末尾,给定size表示读取到size字符所在行为止。
返回值: 返回读取到的内容列表
# 文件对象本身也是一个可迭代对象,在for循环中可以迭代文件的每一行。

for line in f:
     print(line)

3.写入文件

write(data)
功能: 把文本数据或二进制数据块的字符串写入到文件中去
参数:要写入的内容
返回值:写入的字符个数

注意: 如果需要换行要自己在写入内容中添加

writelines(str_list)
功能:接受一个字符串列表作为参数,将它们写入文件。
参数: 要写入的内容列表

4.关闭文件

file_object.close()

5.with操作

with语句格式

with context_expression [as obj]:
    with-body

with访问文件

with open('file','r+') as f:
    f.read()

注意 : with语句块结束后会自动释放f所以不再需要close().

6.缓冲区

缓冲区设置

类型 设置方法 注意事项
系统自定义 buffering = -1  
行缓冲 buffering = 1 当遇到 时刷新缓冲
指定缓冲区大小 buffering >1 必须以二进制方式打开

刷新缓冲区条件

  1. 缓冲区被写满

  2. 程序执行结束或者文件对象被关闭

  3. 程序中调用flush()函数

file_obj.flush()

7.文件偏移量

定义

打开一个文件进行操作时系统会自动生成一个记录,记录每次读写操作时所处的文件位置,每次文件的读写操作都是从这个位置开始进行的。

注意:

  1. r或者w方式打开,文件偏移量在文件开始位置

  2. a方式打开,文件偏移量在文件结尾位置

 文件偏移量控制

tell()
功能:获取文件偏移量大小
返回值:文件偏移量
seek(offset[,whence])
功能: 移动文件偏移量位置
参数:offset  代表相对于某个位置移动的字节数。负数表示向前移动,正数表示向后移动。
     whence是基准位置的默认值为 0,代表从文件开头算起,1代表从当前位置算起,2 代表从文件  末尾算起。

注意:必须以二进制方式打开文件时,基准位置才能是1或者2

os模块

os模块是Python标准库模块,包含了大量的文件处理函数。

获取文件大小

os.path.getsize(file)
功能: 获取文件大小
参数: 指定文件
返回值: 文件大小

查看文件列表

os.listdir(dir)
功能: 查看文件列表
参数: 指定目录
返回值:目录中的文件名列表

查看文件是否存在

os.path.exists(file)
功能: 查看文件是否存在 
参数: 指定文件
返回值:存在返回True,不存在返回False

判断文件类型

os.path.isfile(file)
功能: 判断文件类型 
参数: 指定文件
返回值:普通文件返回True,否则返回False

删除文件

os.remove(file)
功能: 删除文件 
参数: 指定文件
Live what we love, do what we do, follow the heart, and do not hesitate.
原文地址:https://www.cnblogs.com/failan/p/13797487.html