08 输入输出

　　本章内容：

　　　　1、设置字符串的格式

　　　　2、格式字符串

　　　　3、读写文件

　　　　4、检查文件和文件夹

　　　　5、处理文本文件

　　　　6、处理二进制文件

　　　　7、读取网页

------------------------------

　　程序由数据和指令来完成，我除了要编写具有逻辑关系的指令外，还需要输入对应的数据；这里，我们通常称为输入和输出；

　　在前面的内容里面我们介绍了input读取用户输入的字符串。我们需要指定字符串格式，然后了解I/O的读写；还有pickle模块；

1、设置字符串的格式

　　字符串插入式一种设置字符串格式的简单方法；

　　format % values 其中 %.2 和 %.5 都事一个格式配置命令；

　　一些转换说明符号：

　　　　d　　整数

　　　　o　　八进制值

　　　　x　　小写十六进制数

　　　　X　　大写十六进制数

　　　　e　　小写科学计数表示的浮点数

　　　　E　　大写的科学计数表示的浮点数

　　　　f　　浮点数

　　　　s　　字符串

　　　　%　　%字符

　　字符转换表示Python的字符格式：

　　你也可以根据需要再格式字符串中包含任意数量的说明符；

　　如果要再字符串中包含字符%，必须使用“%%”

2、格式字符串

　　另一种创建美观输出的方式是结合使用格式字符串和字符串函数format(value,format_spec)例如：

　　在格式字符串中，用大括号括起的内容都将被替换，这称为命名替换；

　　还可以像字符串插入那样使用转换说明符：

　　也可以使用大括号来指定格式设置参数，如下图：

3、读写文件

　　文件分为两种：文本文件和二进制文件

　　　　1、文本文件

　　　　　　a基本上是磁盘中的字符串；

　　　　　　b可以编辑，对于人来说，容易读取

　　　　　　c对于程序来说难以阅读，需要使用对应的分析程序来进行阅读

　　　　　　d比等价的二进制文件要打，再以太网上传输时一个非常麻烦的事，所以一般需要进行压缩

　　　　2、二进制文件

　　　　　　a人类无法阅读

　　　　　　b程序阅读非常方便

　　　　　　c占用空间比等价的文件要小

　　　　　　d于特定的程序相关联，需要使用该特定的程序来运行这些二进制文件

　　文件夹

　　　　Windows的文件夹表达方式：

　　　　　　‘C:\home\tjd\Desktop\python’

　　　　　　为了避免使用两个反斜线，我们可以使用 r 来指定：

　　　　　　r'C:home jdDesktoppython' 和上相同

　　　　mac和Linux则相同，使用 / 来表示目录，例如：

　　　　　　/home/tjd/Desktop/python

　　Python中表示当前目录的函数-- cwd()

4、检查文件和文件夹

　　Python提供一些函数--用来返回有关计算机文件系统中文件和文件夹的信息；

　　如下：一种常见的任务是获悉当前工作目录中的文件和文件夹。

# list.py
def list_cwd()
　　return os.listdir(os.getcwd())

　　也可以使用列表解析分别返回当前工作目录中的文件和文件夹：

# list.py
def files_cwd():
    return [p for p in list_cwd()
           if os.path.isfile(p)]
def folders_cwd():
    return [p for p in list_cwd()
           if os.path.isdir(p)]

　　实用的文件和文件夹函数：

　　　　os.getcwd()　　返回当前工作目录的名称

　　　　os.listdir(p)　　返回一个字符串列表，其中包含路径p指定的文件夹中所有文件和文件夹名称

　　　　os.chdir(p)　　将当前工作目录设置为路径p

　　　　os.path.isfile(p)　　　当路径p指定的是一个文件的名称时，返回True，否则返回False

　　　　os.path.isdir(p)　　　当路径p指定的是一个文件夹的名称时，返回True，否则返回False

　　　　os.stat(fname)　　　返回有关fname的信息，如大小（单位为字节）和最后一次修改时间

　　如果只想获取当前工作目录中的.py文件，可编写如下函数：

# list.py
def list_py(path = None):
    if path == None
        path = os.getcwd()
    return [fname fo fname in os.listdir(path)
              if os .path.isifle(fname)
              if fname.endswith('.py')]

　　下面的代码函数返回当前工作目录中所有文件大小总合：

# list.py
def size_in_bytes(fname):
    return os.stat(fname).st_size
def cwd_size_in_bytes():
    total = 0
    for name in files_cwd():
        total = total + size_in_bytes(name)
    return total

5、处理文本文件

　　处理文件分为三个步骤

　　逐行读取文本文件：

　　　　每次读取一行，进行处理后，例如：

# printfile.py
def print_file1(fname):
    f = open(fname, 'r')  //打开指定的文件，调用open时，必须指定你要处理的文件名称，还必须指定打开的模式。以“r”读取的模式打开
    for line in f:
        print(line,, end= '')
    f.close() #这行代码是可选的

　　　　注意：open去打开文件的时候，文件没有被读取到内存中；

　　Python文件打开模式：

　　　　r　　为读取而打开文件（默认模式）

　　　　w　　为写入而打开文件

　　　　a　　为在文件末尾附加而打开文件

　　　　b　　二进制模式

　　　　t　　文本模式（默认模式）

　　　　r+　　为读写打开文件

　　将整个文本文件作为一个字符串进行读取：

　　　　除了open(fname)的方式外，还可以使用下面的方式，将其作为一个大型字符串进行读取，如下所示：(比较常用)

# printfile.py
def print_file2(fname)
    f = open(fname, 'r')
    print(f.read())
    f.close()

　　这行代码同下：

print(open(fname, 'r').read())

　　写入文本文件：

　　写入文本文件只比读取文本文件复杂一点点，例如：下面这个函数新建一个名为story.txt的文本文件：

# write.py
def make_story1():
    f = open('story.txt', 'w')  //指定为写入模式
    f.write('Mary had a little lamb,
')  //使用write()函数写入文本内容；
    f.wirte('and then she had some more.
')

　　需要注意的是：如果story.txt已经存在，则调用open('story.txt','w')将会将原有文件覆盖掉；

# write.py
import os
def make _story2():
    if os.path.isfile('story.txt'):
        print('story.txt already exists')
    else:
        f = open('story.txt', 'w')
        f.wirte('Mary had a little lamb,
')
        f.wirte('and then she had some more.
')

　　附加文本文件到末尾

　　将字符串加入到文本文件是，一种常见的方式将它们附加到文件末尾。与模式‘w’不同的是，这种模式不会删除文件即有的内容。例如：

def add_to_story(line, fname = 'story.txt')
    f = open(fname, 'a')  //文件一附加模式 ‘a’ 打开的
    f.write(line)

　　将字符串插入到文件头部

　　我们需要将文件读取到一个字符串中，将新文本插入到该字符串，再将这个字符串写入原来的文件，如下：

def insert_title(title, fname = 'story.txt'):
    f = open(fname, 'r+')
    temp = f.read()
    temp = title + '

' + temp
    f.seek(o)  #让文件指针指向文件开头
    f.write(temp)

　　f.read() 使得文件指针指向文件末尾，而f.seek()则将指针指向文件开头；

6、处理二进制文件

　　在Python中，如果不是文本文件，则统一被认为是二进制文件，以“b”开头；

def is_gif(fname)
    f = open(, 'br')
    first4 = tuple(f.read(4))
    return first4 == (0x47, 0x49, 0x46, 0x38)

　　检查开启的文件是不是图像文件，就检查二进制开始的文件开头是不是（0x47,0x49,0x46,0x38）这四个字节；

　　在而Python中，两个十六进制数可以描述一个字节，这一点非常方便；

　　pickle

　　二进制的数据对于数据处理效率非常高，但是在高级语言中处理起来则非常困难，而pickle模块则是用来让你能够轻松的读写几乎任何数据结构，如下所示：

# picklefile.py
import pickle
def make_pickled_file():
    grades = {'alan' : [4,8,10,10], 'tom':[7,7,7,8],'dan':[5,None,7,7],'may':[10,8,10,10]}
    outfile = open('grades.dat','wb')
    pickle.dump(grades, outfile)
    
def get_pickled_data()
    infile = open('grades.dat', 'rb')
    grades = pickle.load(infile)
    return grades

　　基本上，你可以使用pickle.dump将数据结构存储到磁盘，以后再使用pickle.load从磁盘获取数据结构。如果需要存储二进制的数据，可以考虑这种方式。

7、读取网页

　　Python为范文网络提供了强大的支持。一种常见任务是让程序自动读取网页，而是用模块 urllib 可轻松的完成这种任务；

　　这里的就和我们去http://python.org网站的源代码相同：

　　另外一个绝妙的模块是webbrowser，他让你能够以编程的方式流量器中显示网页。

　　例如：

　　这样就能指定打开流量器：