Python基础之模块

什么是模块?

一个模块就是一个包含了Python定义和声明的文件,文件名就是模块名字加上.py的后缀。

但其实import加载的模块分为以下四个通用类别:

1、使用Python编写的代码(.py文件);

2、已被比编译为共享库或DLL的C或者C++的扩展; 

3、包好一组模块的包;

4、使用C编写并连接到Python解释器的内置模块。

为何要使用模块?

如果你退出Python解释器然后重新进入,那么你之前定义的函数或者变量都将丢失,因此我们通常将程序写到文件中,以便永久保存下来。需要时就通过Python test.py的方式去执行,此时test.py被称为脚本script。
随着程序的发展,功能越来越多,为了方便管理,我们通常将程序分成一个个的文件,这样做程序的结构清晰,方便管理。这是我们不仅仅可以把这些文件当做脚本去执行,还可以把它们当做模块来导入到其它的模块中,实现了功能的重复利用。

模块的导入:直接导入文件的名字,不需要带着后缀

模块中的函数调用:模块名.函数名()

模块导入的时候后台做了以下三件事:

1、开辟了一个新的命名空间;

2、执行模块内的代码;

3、将模块里面的名字都和模块绑定在一起。

模块在一个程序中只会被导入一次,不会被重复导入。

模块导入后,会将模块存储在内存中,当再次导入时就到内存中去查看是否导入过这个模块,如果有导入过后就不继续导入了。

常用模块及功能图

一、collections模块

collections模块功能:在内置数据类型(dict、list、set、tuple)的基础上,collections模块还提供了几个额外的数据类型:Counter、deque、 defaultdict、namedtuple、OrderedDict等。

1、namedtuple:生成可以使用名字来访问元素内容的tuple;

  我们知道tuple可以表示不变集合,例如一个点的二维坐标就可以表示成:

p = (1,2)

  但是,看到(1,2)很难看出这个tuple是用来表示一个坐标的。

  这时namedtuple就派上了用场:   

from collections import namedtuple        #调用模块
Point = namedtuple('Point',['x','y'])
p = Point(1,2)
print(p.x)                #输出结果1        
print(p.y)                #输出结果2

2、deque:双端队列,可以快速的从另外一侧追加和推出对象;

  使用list存储数据时,按索引访问元素很快,但是插入和删除元素就很慢了,因为list时线性存储,数据量大的时候插入和删除的效率很低。
  deque是为了高效实现插入和删除操作的双向列表,使用适合用于队列和栈: 

from collections import deque
q = deque(['a','b','c'])
q.append('x')               #默认从最后增加
print(q)
q.appendleft('y')           #指定从左边开始增加
print(q)

  deque实现了list的append()和pop()外,还支持appendleft()和popleft(),这样就可以非常高效地从头部添加或删除元素。

3、Counter:计数器,主要用来计数;

  Counter类的目的是用来跟踪值出现的次数。它是一个无序的容器类型,以字典的键值对形式存储,其中元素作为key,其计数作为value。计数值可以是任意的Interger(包括0和负数)。Counter类和其他语言的bags或multisets很相似。

4、defaultdict:带有默认值的字典:

  有如下值集合 [11,22,33,44,55,66,77,88,99,90...],将所有大于 66 的值保存至字典的第一个key中,将小于 66 的值保存至第二个key的值中。

dic1 = {}
list2 = [11,22,33,44,55,66,77,88,99,90]
for i in list2:
    if i >= 66:
        dic1.setdefault('k1',[]).append(i)
    else:
        dic1.setdefault('k2',[]).append(i)
print(('大于66的数字有:%s')%dic1['k1'])
print(('小于66的数字有:%s')%dic1['k2'])
#输出结果:大于66的数字有:[66, 77, 88, 99, 90]
#小于66的数字有:[11, 22, 33, 44, 55]

  defaultdict字典解决方法  

from collections import defaultdict
values = [11,22,33,44,55,66,77,88,99,90]
my_dict = defaultdict(list)
for value in values:
    if value > 66:
        my_dict['k1'].append(value)
    else:
        my_dict['ke'].append(value)
print(my_dict)

5、OrderedDict:

  使用dict时,key时无序的。在对dict做迭代时,我们无法确定key的顺序。

  如果要保持key的顺序,可以用OrferedDict:

二、时间模块(time)

  在Python中,通常有这三种方式来表示时间:时间戳、元祖(struct)、格式化的时间字符串

  1)时间(timestamp):通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行‘type(time())’,返回的是float类型。

  2)格式化的时间字符串(Format String):‘1999-12-06’

%y 两位数的年份表示(00-99%Y 四位数的年份表示(000-9999%m 月份(01-12%d 月内中的一天(0-31%H 24小时制小时数(0-23%I 12小时制小时数(01-12%M 分钟数(00=59%S 秒(00-59%a 本地简化星期名称
%A 本地完整星期名称
%b 本地简化的月份名称
%B 本地完整的月份名称
%c 本地相应的日期表示和时间表示
%j 年内的一天(001-366%p 本地A.M.或P.M.的等价符
%U 一年中的星期数(00-53)星期天为星期的开始
%w 星期(0-6),星期天为星期的开始
%W 一年中的星期数(00-53)星期一为星期的开始
%x 本地相应的日期表示
%X 本地相应的时间表示
%Z 当前时区的名称
%% %号本身

  3)元祖(struct_time):struct_time元祖共有9个元素:(年月日时分秒,一年中第几周,一年中第几天等)

首先,我们先导入time模块,来认识一下Python中表示时间的几中格式:

#导入时间模块
import time
#时间戳 # print(time.time()) #输出结果:1502182682.9042535
#时间字符串: # t = time.strftime("%Y-%m-%d %X") # print(t) #输出结果:2017-08-08 16:59:36
# 时间元祖:localtime将一个时间戳转换为当前时区的struct_time print(time.localtime()) #输出结果 time.struct_time(tm_year=2017, tm_mon=7, tm_mday=24,tm_hour=13, tm_min=59, tm_sec=37,tm_wday=0, tm_yday=205, tm_isdst=0)

小结:时间戳是计算机能够识别的时间,时间字符串是人类能够看懂的时间,元祖则是用来操作时间的。

集中格式之间如何转换?

三、random模块

  描述:random()方法是返回随机生成的一个实数,它在(0-1)范围内。

  语法如下:

import random

random.random()

  注意事项:random()是不能直接访问的,需要导入random模块,然后通过random()静态对象调用该方法。

  实例:以下展示了使用random()方法的实例: 

import random

# 第一个随机数
print ("random() : ", random.random())  #输出结果:random() :  0.09331619659624946

# 第二个随机数
print ("random() : ", random.random())  #输出结果:random() :  0.8664962793234653


import random
print(random.randint(1,5))  #大于等于1且小于等于5之间的整数
print(random.randrange(1,10,2))     #大于等于1且小于等于10,步长为2

# 随机选择一个返回
print(random.choice([1,'23',[4,5]]))  #随机选择1个返回。
print(random.choice([1,'23',[4,5]]),2)  #随机选择多个返回,返回的个数为函数的第二个参数。

四、OS模块

os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径
os.chdir("dirname")  改变当前脚本工作目录;相当于shell下cd
os.curdir  返回当前目录: ('.')
os.pardir  获取当前目录的父目录字符串名:('..')
os.makedirs('dirname1/dirname2')    可生成多层递归目录
os.removedirs('dirname1')    若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.mkdir('dirname')    生成单级目录;相当于shell中mkdir dirname
os.rmdir('dirname')    删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
os.listdir('dirname')    列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.remove()  删除一个文件
os.rename("oldname","newname")  重命名文件/目录
os.stat('path/filename')  获取文件/目录信息
os.sep    输出操作系统特定的路径分隔符,win下为"\",Linux下为"/"
os.linesep    输出当前平台使用的行终止符,win下为"	
",Linux下为"
"
os.pathsep    输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name    输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.system("bash command")  运行shell命令,直接显示
os.popen("bash command)  运行shell命令,获取执行结果
os.environ  获取系统环境变量

os.path
os.path.abspath(path) 返回path规范化的绝对路径 os.path.split(path) 将path分割成目录和文件名二元组返回 os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 os.path.basename(path) 返回path最后的文件名。如何path以/或结尾,那么就会返回空值。
                        即os.path.split(path)的第二个元素
os.path.exists(path)  如果path存在,返回True;如果path不存在,返回False
os.path.isabs(path)  如果path是绝对路径,返回True
os.path.isfile(path)  如果path是一个存在的文件,返回True。否则返回False
os.path.isdir(path)  如果path是一个存在的目录,则返回True。否则返回False
os.path.join(path1[, path2[, ...]])  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.getatime(path)  返回path所指向的文件或者目录的最后访问时间
os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
os.path.getsize(path) 返回path的大小

注意:os.stat('path/filename')  获取文件/目录信息 的结构说明

stat 结构:

st_mode: inode 保护模式
st_ino: inode 节点号。
st_dev: inode 驻留的设备。
st_nlink: inode 的链接数。
st_uid: 所有者的用户ID。
st_gid: 所有者的组ID。
st_size: 普通文件以字节为单位的大小;包含等待某些特殊文件的数据。
st_atime: 上次访问的时间。
st_mtime: 最后一次修改的时间。
st_ctime: 由操作系统报告的"ctime"。在某些系统上(如Unix)是最新的元数据更改的时间,在其它系统上(如Windows)是创建时间(详细信息参见平台的文档)。

五、SYS模块

sys模块是与Python解释器交互的一个接口

sys.argv           命令行参数List,第一个元素是程序本身路径
sys.exit(n)        退出程序,正常退出时exit(0)
sys.version        获取Python解释程序的版本信息
sys.maxint         最大的Int值
sys.path           返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform       返回操作系统平台名称

六、序列化模块

 1、什么叫有序化?

  将原本的字典、列表等内容转换成一个字符串的过程就叫做序列化。

2、序列化的目的:

  a.以某种存储形式使自定义对象持久化;

  b.将对象从一个地方传递到另一个地方;

  c.使程序更具维护性。

 七、导图

原文地址:https://www.cnblogs.com/bingpan/p/7308279.html