time 模块:
在Python中,通常有这三种方式来表示时间:时间戳、元组(struct_time)、格式化的时间字符串:
(1)时间戳(timestamp) :通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.time())”,返回的是float类型。
import time time.time() # 当前时间 Out[3]: 1498050122.8564734
time.strftime("%Y-%m-%d %X") # 格式化字符串 Out[4]: '2017-06-21 21:03:31'
time.localtime() Out[5]: time.struct_time(tm_year=2017, tm_mon=6, tm_mday=21, tm_hour=21, tm_min=5, tm_sec=18, tm_wday=2, tm_yday=172, tm_isdst=0)
time.strptime('2017-06-21','%Y-%m-%d') # 将字符串转成结构化的时间 Out[7]: time.struct_time(tm_year=2017, tm_mon=6, tm_mday=21, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=2, tm_yday=172, tm_isdst=-1)
转成时间戳:
time.mktime(time.strptime('2017-06-21','%Y-%m-%d')) Out[9]: 1497974400.0
将时间戳转成格式化字符串:
time.localtime() Out[11]: time.struct_time(tm_year=2017, tm_mon=6, tm_mday=21, tm_hour=21, tm_min=22, tm_sec=36, tm_wday=2, tm_yday=172, tm_isdst=0)
另外还有一个固定格式的字符串转化:
time.asctime() #将格式时间转成格式化字符串 Out[12]: 'Wed Jun 21 21:25:19 2017' time.ctime(144797400) # 将一个时间戳转成格式化时间 Out[15]: 'Sun Aug 4 05:30:00 1974'
random模块:
随机数模块
import random random.random() # 它产生一个0到1之间的随机数 Out[17]: 0.877809098050091
random.randint:
random.randint(1,5) # 产生一个随机的整数,可以包含两侧。 Out[18]: 5 random.randint(1,5) Out[19]: 4 random.randint(1,5) Out[20]: 2
random.randrange:
random.randrange(1,5) # 在1,5之间选择一个值 Out[26]: 4
random.choice:
random.choice([1,2,3,4]) # 从指定系列中随机选择一个值 Out[29]: 1
random.sample:
random.sample([1,2,3,4,5],3 ) # 从指定系列或元组中选择指定个数的元素。 Out[31]: [3, 5, 2]
random.uniform:
random.uniform(1,5) # 从1,5之间选择一个随机数 Out[33]: 4.178862041759434
random.shuffle:
random.shuffle(a) # 打乱次序 a Out[38]: [3, 2, 4, 5, 1]
hashlib
Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等。
: import hashlib In [4]: md = hashlib.md5() In [5]: md.update(b'hello word') # 注意这里字符串应该转成bytes类型 In [6]: md.hexdigest() Out[6]: '13574ef0d58b50fab38ec841efe39df4'
如果有多个字符串,分多次update,最后结果是一样的。上面是helllo word
这里分为hello 和word 注意是word,不是world
In [12]: md1 = hashlib.md5() In [13]: md1.update(b'hello ') # 此处有一个空格 In [14]: md1.update(b'word') In [15]: md1.hexdigest() Out[15]: '13574ef0d58b50fab38ec841efe39df4'
主要有这几种算法: md5(), sha1(), sha224(), sha256(), sha384(), and sha512()
os模块
os模块是与操作系统交互的一个接口
In [17]: import os In [18]: os.getcwd() # 获取当前目录工作目录 Out[18]: 'C:\Users\zjgxs'
#改变当前脚本工作目录;相当于shell下cd
os.chdir("dirname")
os.curdir 返回当前目录: ('.')
In [4]: os.curdir Out[4]: '.'
os.pardir 获取当前目录的父目录字符串名
In [5]: os.pardir Out[5]: '..'
os.makedirs 递归生成多级目录
os.mkdir('dirname') 生成单级目录
删除及命名:
os.remove() 删除一个文件 os.removedirs('dirname1') 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推 os.rmdir('dirname') 删除单级空目录,若目录不为空则无法删除 os.listdir('dirname') 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印 os.rename("oldname","newname") 重命名文件/目录
os.stat('path/filename') 获取文件/目录信息
In [7]: os.stat('.vim')
Out[7]: os.stat_result(st_mode=16895, st_ino=9007199254746640, st_dev=2625362903, st_nlink=1, st_uid=0, st_gid=0, st_size=0, st_atime=1487656973, st_mtime=1487656973, s
t_ctime=1487656973)
路径相隔符相关:
os.sep 输出操作系统特定的路径分隔符,win下为"\",Linux下为"/" os.linesep 输出当前平台使用的行终止符,win下为" ",Linux下为" " os.pathsep 输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name 输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.system("bash command") 运行shell命令,直接显示 os.environ 获取系统环境变量
路径相关:
os.path.abspath(path) 返回path规范化的绝对路径 os.path.split(path) 将path分割成目录和文件名二元组返回 os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 os.path.basename(path) 返回path最后的文件名。如何path以/或结尾,那么就会返回空值。即os.path.split(path)的第二个元素 os.path.exists(path) 如果path存在,返回True;如果path不存在,返回False os.path.isabs(path) 如果path是绝对路径,返回True os.path.isfile(path) 如果path是一个存在的文件,返回True。否则返回False os.path.isdir(path) 如果path是一个存在的目录,则返回True。否则返回False os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略 os.path.getatime(path) 返回path所指向的文件或者目录的最后存取时间 os.path.getmtime(path) 返回path所指向的文件或者目录的最后修改时间 os.path.getsize(path) 返回path的大小
sys模块
sys.argv 命令行参数List,第一个元素是程序本身路径 sys.exit(n) 退出程序,正常退出时exit(0) sys.version 获取Python解释程序的版本信息 sys.maxint 最大的Int值 sys.path 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值 sys.platform 返回操作系统平台名称
logging模块
默认情况下Python的logging模块将日志打印到了标准输出中,且只显示了大于等于WARNING级别的日志,
这说明默认的日志级别设置为WARNING(日志级别等级CRITICAL > ERROR > WARNING > INFO > DEBUG),
默认的日志格式为日志级别:Logger名称:用户输出消息。
#!/usr/bin/env python #coding:utf-8 # Created by Andy @ 2017/6/22 import logging logging.debug('debug message') logging.info('info message') logging.warning('warning message') logging.error('error message') logging.critical('critical message')
#output:
WARNING:root:warning message
ERROR:root:error message
CRITICAL:root:critical message
默认情况下Python的logging模块将日志打印到了标准输出中,且只显示了大于等于WARNING级别的日志,
这说明默认的日志级别设置为WARNING(日志级别等级CRITICAL > ERROR > WARNING > INFO > DEBUG),
默认的日志格式为日志级别:Logger名称:用户输出消息。
这里可供设置的主要参数有:
logging.basicConfig()函数中可通过具体参数来更改logging模块默认行为,可用参数有:
filename:用指定的文件名创建FiledHandler,这样日志会被存储在指定的文件中。
filemode:文件打开方式,在指定了filename时使用这个参数,默认值为“a”还可指定为“w”。
format:指定handler使用的日志显示格式。
datefmt:指定日期时间格式。
level:设置rootlogger(后边会讲解具体概念)的日志级别
stream:用指定的stream创建StreamHandler。可以指定输出到sys.stderr,sys.stdout或者文件(f=open(‘test.log’,’w’)),默认为sys.stderr。若同时列出了filename和stream两个参数,则stream参数会被忽略。
format参数中可能用到的格式化串:
%(name)s Logger的名字
%(levelno)s 数字形式的日志级别
%(levelname)s 文本形式的日志级别
%(pathname)s 调用日志输出函数的模块的完整路径名,可能没有
%(filename)s 调用日志输出函数的模块的文件名
%(module)s 调用日志输出函数的模块名
%(funcName)s 调用日志输出函数的函数名
%(lineno)d 调用日志输出函数的语句所在的代码行
%(created)f 当前时间,用UNIX标准的表示时间的浮 点数表示
%(relativeCreated)d 输出日志信息时的,自Logger创建以 来的毫秒数
%(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
%(thread)d 线程ID。可能没有
%(threadName)s 线程名。可能没有
%(process)d 进程ID。可能没有
%(message)s用户输出的消息
序列模块 json,pickle, shelve
我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling。序列化之后,就可以把序列化后的内容写入磁盘,或者通过网络传输到别的机器上。反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化,即unpickling。
python ,json对应数据类型:
json的四种方法: dumps ,dump, load, loads:
#!/usr/bin/env python #coding:utf-8 # Created by Andy @ 2017/6/25 import json dic = {'name':'andy', 'age':20, 'gender':'male'} data_dump = json.dumps(dic) print("data_dumps:", data_dump) data_load = json.loads(data_dump) print("data_loads:",data_load) with open('data.json','w') as f: data_dump = json.dump(dic,f) print("data_dump:",data_dump) with open('data.json','r') as f: data_load = json.load(f) print("data_load:",data_load)
#output:
data_dumps: {"name": "andy", "gender": "male", "age": 20}
data_loads: {'name': 'andy', 'age': 20, 'gender': 'male'}
data_dump: None
data_load: {'name': 'andy', 'age': 20, 'gender': 'male'}
dump, load与dumps, loads的区别是它可以将序列化的数据写入文件对象。
pickle
pickle与json的方法一样,它的区别是:pickle支持python的所有数据类型
import pickle dic = {'name':'andy', 'age':20, 'gender':'male'} data_dump = pickle.dumps(dic) print("data_dumps:", data_dump) data_load = pickle.loads(data_dump) print("data_loads:",data_load) with open('data.pickle','wb') as f: # 必须以b的形式打开 data_dump = pickle.dump(dic,f) print("data_dump:",data_dump) with open('data.pickle','rb') as f: data_load = pickle.load(f) print("data_load:",data_load) # output: data_dumps: b'x80x03}qx00(Xx06x00x00x00genderqx01Xx04x00x00x00maleqx02Xx04x00x00x00nameqx03Xx04x00x00x00andyqx04Xx03x00x00x00ageqx05Kx14u.' data_loads: {'gender': 'male', 'name': 'andy', 'age': 20} data_dump: None data_load: {'gender': 'male', 'name': 'andy', 'age': 20}
shelve
对于shelve模块, key必须为字符串,而值可以是python所支持的数据类型,且只有一个open函数
以键值对的形式存储数据,获取数据也只需要键来取值:
import shelve s = shelve.open('data.shelve') s['info'] = {'name':'andy','age':20,'gender':'male'} print(s['info']) s.close()
#output:
{'name': 'andy', 'gender': 'male', 'age': 20}
configparser
该模块适用于配置文件的格式与windows ini文件类似,可以包含一个或多个节(section),每个节可以有多个参数(键=值)。
软件的常见文档格式如下:
[DEFAULT] ServerAliveInterval = 45 Compression = yes CompressionLevel = 9 ForwardX11 = yes [bitbucket.org] User = hg [topsecret.server.com] Port = 50022 ForwardX11 = no
如果想用python生成一个这样的文档怎么做呢?
import configparser config = configparser.ConfigParser() config["DEFAULT"] = {'ServerAliveInterval': '45', 'Compression': 'yes', 'CompressionLevel': '9', 'ForwardX11':'yes' } config['bitbucket.org'] = {'User':'hg'} config['topsecret.server.com'] = {'Host Port':'50022','ForwardX11':'no'} with open('example.ini', 'w') as configfile: config.write(configfile)
查找文件:
import configparser config = configparser.ConfigParser() #---------------------------查找文件内容,基于字典的形式 print(config.sections()) # [] config.read('example.ini') print(config.sections()) # ['bitbucket.org', 'topsecret.server.com'] print('bytebong.com' in config) # False print('bitbucket.org' in config) # True print(config['bitbucket.org']["user"]) # hg print(config['DEFAULT']['Compression']) #yes print(config['topsecret.server.com']['ForwardX11']) #no print(config['bitbucket.org']) #<Section: bitbucket.org> for key in config['bitbucket.org']: # 注意,有default会默认default的键 print(key) print(config.options('bitbucket.org')) # 同for循环,找到'bitbucket.org'下所有键 print(config.items('bitbucket.org')) #找到'bitbucket.org'下所有键值对 print(config.get('bitbucket.org','compression')) # yes get方法取深层嵌套的值
增删改:
import configparser config = configparser.ConfigParser() config.read('example.ini') config.add_section('yuan') config.remove_section('bitbucket.org') config.remove_option('topsecret.server.com',"forwardx11") config.set('topsecret.server.com','k1','11111') config.set('yuan','k2','22222') config.write(open('new2.ini', "w"))