Python基础之模块

什么是模块？

一个模块就是一个包含了Python定义和声明的文件，文件名就是模块名字加上.py的后缀。

但其实import加载的模块分为以下四个通用类别：

1、使用Python编写的代码（.py文件）；

2、已被比编译为共享库或DLL的C或者C++的扩展；

3、包好一组模块的包；

4、使用C编写并连接到Python解释器的内置模块。

为何要使用模块？

如果你退出Python解释器然后重新进入，那么你之前定义的函数或者变量都将丢失，因此我们通常将程序写到文件中，以便永久保存下来。需要时就通过Python test.py的方式去执行，此时test.py被称为脚本script。
随着程序的发展，功能越来越多，为了方便管理，我们通常将程序分成一个个的文件，这样做程序的结构清晰，方便管理。这是我们不仅仅可以把这些文件当做脚本去执行，还可以把它们当做模块来导入到其它的模块中，实现了功能的重复利用。

模块的导入：直接导入文件的名字，不需要带着后缀

模块中的函数调用：模块名.函数名()

模块导入的时候后台做了以下三件事：

1、开辟了一个新的命名空间；

2、执行模块内的代码；

3、将模块里面的名字都和模块绑定在一起。

模块在一个程序中只会被导入一次，不会被重复导入。

模块导入后，会将模块存储在内存中，当再次导入时就到内存中去查看是否导入过这个模块，如果有导入过后就不继续导入了。

常用模块及功能图

一、collections模块

collections模块功能：在内置数据类型（dict、list、set、tuple）的基础上，collections模块还提供了几个额外的数据类型：Counter、deque、 defaultdict、namedtuple、OrderedDict等。

1、namedtuple：生成可以使用名字来访问元素内容的tuple；

　　我们知道tuple可以表示不变集合，例如一个点的二维坐标就可以表示成：

p = (1,2)

　　但是，看到（1,2）很难看出这个tuple是用来表示一个坐标的。

　　这时namedtuple就派上了用场：　　　

from collections import namedtuple　　　　    #调用模块
Point = namedtuple('Point',['x','y'])
p = Point(1,2)
print(p.x)                #输出结果1        
print(p.y)                #输出结果2

2、deque：双端队列，可以快速的从另外一侧追加和推出对象；

　　使用list存储数据时，按索引访问元素很快，但是插入和删除元素就很慢了，因为list时线性存储，数据量大的时候插入和删除的效率很低。
　　deque是为了高效实现插入和删除操作的双向列表，使用适合用于队列和栈：　

from collections import deque
q = deque(['a','b','c'])
q.append('x')               #默认从最后增加
print(q)
q.appendleft('y')           #指定从左边开始增加
print(q)

　　deque实现了list的append()和pop()外，还支持appendleft()和popleft()，这样就可以非常高效地从头部添加或删除元素。

3、Counter：计数器，主要用来计数；

　　Counter类的目的是用来跟踪值出现的次数。它是一个无序的容器类型，以字典的键值对形式存储，其中元素作为key，其计数作为value。计数值可以是任意的Interger（包括0和负数）。Counter类和其他语言的bags或multisets很相似。

4、defaultdict：带有默认值的字典：

　　有如下值集合 [11,22,33,44,55,66,77,88,99,90...]，将所有大于 66 的值保存至字典的第一个key中，将小于 66 的值保存至第二个key的值中。

dic1 = {}
list2 = [11,22,33,44,55,66,77,88,99,90]
for i in list2:
    if i >= 66:
        dic1.setdefault('k1',[]).append(i)
    else:
        dic1.setdefault('k2',[]).append(i)
print(('大于66的数字有:%s')%dic1['k1'])
print(('小于66的数字有:%s')%dic1['k2'])
#输出结果:大于66的数字有:[66, 77, 88, 99, 90]
#小于66的数字有:[11, 22, 33, 44, 55]

　　defaultdict字典解决方法　　

from collections import defaultdict
values = [11,22,33,44,55,66,77,88,99,90]
my_dict = defaultdict(list)
for value in values:
    if value > 66:
        my_dict['k1'].append(value)
    else:
        my_dict['ke'].append(value)
print(my_dict)

5、OrderedDict：

　　使用dict时，key时无序的。在对dict做迭代时，我们无法确定key的顺序。

　　如果要保持key的顺序，可以用OrferedDict：

二、时间模块（time）

　　在Python中，通常有这三种方式来表示时间：时间戳、元祖（struct）、格式化的时间字符串

　　1）时间（timestamp）:通常来说，时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行‘type(time())’,返回的是float类型。

　　2）格式化的时间字符串（Format String）：‘1999-12-06’

%y 两位数的年份表示（00-99）
%Y 四位数的年份表示（000-9999）
%m 月份（01-12）
%d 月内中的一天（0-31）
%H 24小时制小时数（0-23）
%I 12小时制小时数（01-12）
%M 分钟数（00=59）
%S 秒（00-59）
%a 本地简化星期名称
%A 本地完整星期名称
%b 本地简化的月份名称
%B 本地完整的月份名称
%c 本地相应的日期表示和时间表示
%j 年内的一天（001-366）
%p 本地A.M.或P.M.的等价符
%U 一年中的星期数（00-53）星期天为星期的开始
%w 星期（0-6），星期天为星期的开始
%W 一年中的星期数（00-53）星期一为星期的开始
%x 本地相应的日期表示
%X 本地相应的时间表示
%Z 当前时区的名称
%% %号本身

　　3）元祖（struct_time)：struct_time元祖共有9个元素：（年月日时分秒，一年中第几周，一年中第几天等）

首先，我们先导入time模块，来认识一下Python中表示时间的几中格式：

#导入时间模块
import time

#时间戳
# print(time.time())
#输出结果：1502182682.9042535

#时间字符串：
# t = time.strftime("%Y-%m-%d %X")
# print(t)
#输出结果：2017-08-08 16:59:36

# 时间元祖：localtime将一个时间戳转换为当前时区的struct_time
print(time.localtime())
#输出结果 time.struct_time(tm_year=2017, tm_mon=7, tm_mday=24,tm_hour=13, tm_min=59, tm_sec=37,tm_wday=0, tm_yday=205, tm_isdst=0)

小结：时间戳是计算机能够识别的时间，时间字符串是人类能够看懂的时间，元祖则是用来操作时间的。

集中格式之间如何转换？

三、random模块

　　描述：random()方法是返回随机生成的一个实数，它在（0-1）范围内。

　　语法如下：

import random

random.random()

　　注意事项：random()是不能直接访问的，需要导入random模块，然后通过random()静态对象调用该方法。

　　实例：以下展示了使用random()方法的实例：　

import random

# 第一个随机数
print ("random() : ", random.random())  #输出结果：random() :  0.09331619659624946

# 第二个随机数
print ("random() : ", random.random())  #输出结果：random() :  0.8664962793234653


import random
print(random.randint(1,5))  #大于等于1且小于等于5之间的整数
print(random.randrange(1,10,2))     #大于等于1且小于等于10，步长为2

# 随机选择一个返回
print(random.choice([1,'23',[4,5]]))  #随机选择1个返回。
print(random.choice([1,'23',[4,5]]),2)  #随机选择多个返回，返回的个数为函数的第二个参数。

四、OS模块

os.getcwd() 获取当前工作目录，即当前python脚本工作的目录路径
os.chdir("dirname")  改变当前脚本工作目录；相当于shell下cd
os.curdir  返回当前目录: ('.')
os.pardir  获取当前目录的父目录字符串名：('..')
os.makedirs('dirname1/dirname2')    可生成多层递归目录
os.removedirs('dirname1')    若目录为空，则删除，并递归到上一级目录，如若也为空，则删除，依此类推
os.mkdir('dirname')    生成单级目录；相当于shell中mkdir dirname
os.rmdir('dirname')    删除单级空目录，若目录不为空则无法删除，报错；相当于shell中rmdir dirname
os.listdir('dirname')    列出指定目录下的所有文件和子目录，包括隐藏文件，并以列表方式打印
os.remove()  删除一个文件
os.rename("oldname","newname")  重命名文件/目录
os.stat('path/filename')  获取文件/目录信息
os.sep    输出操作系统特定的路径分隔符，win下为"\",Linux下为"/"
os.linesep    输出当前平台使用的行终止符，win下为"	
",Linux下为"
"
os.pathsep    输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name    输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.system("bash command")  运行shell命令，直接显示
os.popen("bash command)  运行shell命令，获取执行结果
os.environ  获取系统环境变量

os.path
os.path.abspath(path) 返回path规范化的绝对路径 os.path.split(path) 将path分割成目录和文件名二元组返回 os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 os.path.basename(path) 返回path最后的文件名。如何path以／或结尾，那么就会返回空值。
                        即os.path.split(path)的第二个元素
os.path.exists(path)  如果path存在，返回True；如果path不存在，返回False
os.path.isabs(path)  如果path是绝对路径，返回True
os.path.isfile(path)  如果path是一个存在的文件，返回True。否则返回False
os.path.isdir(path)  如果path是一个存在的目录，则返回True。否则返回False
os.path.join(path1[, path2[, ...]])  将多个路径组合后返回，第一个绝对路径之前的参数将被忽略
os.path.getatime(path)  返回path所指向的文件或者目录的最后访问时间
os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
os.path.getsize(path) 返回path的大小

注意：os.stat('path/filename') 获取文件/目录信息的结构说明

stat 结构:

st_mode: inode 保护模式
st_ino: inode 节点号。
st_dev: inode 驻留的设备。
st_nlink: inode 的链接数。
st_uid: 所有者的用户ID。
st_gid: 所有者的组ID。
st_size: 普通文件以字节为单位的大小；包含等待某些特殊文件的数据。
st_atime: 上次访问的时间。
st_mtime: 最后一次修改的时间。
st_ctime: 由操作系统报告的"ctime"。在某些系统上（如Unix）是最新的元数据更改的时间，在其它系统上（如Windows）是创建时间（详细信息参见平台的文档）。

五、SYS模块

sys模块是与Python解释器交互的一个接口

sys.argv           命令行参数List，第一个元素是程序本身路径
sys.exit(n)        退出程序，正常退出时exit(0)
sys.version        获取Python解释程序的版本信息
sys.maxint         最大的Int值
sys.path           返回模块的搜索路径，初始化时使用PYTHONPATH环境变量的值
sys.platform       返回操作系统平台名称

六、序列化模块

1、什么叫有序化？

　　将原本的字典、列表等内容转换成一个字符串的过程就叫做序列化。

2、序列化的目的：

　　a.以某种存储形式使自定义对象持久化；

　　b.将对象从一个地方传递到另一个地方；

　　c.使程序更具维护性。