常用模块

一. collections模块

  1.namedtuple(用来表示坐标)

from collections import namedtuple

point=namedtuple('point',['x','y'])
p=point(1,2)
print(p.x)
print(p.y)




circle=namedtuple('circle',['x','y','r'])
c=circle(1,2,3)
print(c)
 

 

  2.deque(deque是为了高效实现插入和删除操作的双向列表,适合用于队列和栈:)

from collections import deque

a=deque(['a','b','c'])
a.append('1')
a.appendleft('3')
print(a)



#deque(['3', 'a', 'b', 'c', '1'])
from collections import deque
q=deque(['a','b','c'])
print(q.pop())
print(q)
print(q.popleft())
print(q)




#c
#deque(['a', 'b'])
#a
#deque(['b'])

  3.OrderedDict(可以保持key的顺序)

from collections import OrderedDict
d = OrderedDict([('a', 1), ('b', 2), ('c', 3)])
print(d)




#OrderedDict([('a', 1), ('b', 2), ('c', 3)])

  4.defalutdict

  有如下值集合 [11,22,33,44,55,66,77,88,99,90...],将所有大于 66 的值保存至字典的第一个key中,将小于 66 的值保存至第二个key的值中。

values = [11, 22, 33,44,55,66,77,88,99,90]

my_dict = {}

for value in  values:
    if value>66:
        if 'k1' in my_dict:
            my_dict['k1'].append(value)
        else:
            my_dict['k1'] = [value]
    else:
        if 'k2' in my_dict:
            my_dict['k2'].append(value)
        else:
            my_dict['k2'] = [value]
print(my_dict)
from collections import defaultdict

values = [11, 22, 33,44,55,66,77,88,99,90]

my_dict = defaultdict(list)

for value in  values:
    if value>66:
        my_dict['k1'].append(value)
    else:
        my_dict['k2'].append(value)

二.  时间模块

import time
# print(time.time())   #时间戳
# print(time.strftime("%Y-%m-%d %H:%M:%S"))  #对应的当时时间字符串
# print(time.localtime())  #对应的当地的结构化时间
# print(time.gmtime())   #当时的伦敦当地时间


#将结构化时间转化为时间戳
# time_tuple = time.localtime(1500000000)
# ret = time.mktime(time_tuple)
# print(ret)


# #将结构化时间转化为字符串时间
print(time.strftime("%Y-%m-%d",time.localtime(1500000000)))

#字符串时间转化为结构化时间
ret=time.strptime("2017-03-16","%Y-%m-%d")
print(ret)

  计算时间差

#将时间转化为时间戳
true_time=time.mktime(time.localtime(1600000000))
now_time=time.mktime(time.localtime())
#两者进行相减
dif_time=true_time-now_time
#将结果转化为伦敦时间
struct_time=time.gmtime(dif_time)
#再与1970年一月一日相减结果就是所求时间
print('还剩%d年%d月%d天%d小时%d分钟%d秒'%(struct_time.tm_year-1970,struct_time.tm_mon-1,
                                       struct_time.tm_mday-1,struct_time.tm_hour,
                                       struct_time.tm_min,struct_time.tm_sec))

三. random模块

import random

print(random.random())
#0.5397941284620414随机匹配0-1之间的数

print(random.randint(1,5))
#3随机匹配1-5之间的整数包括1和5

print(random.randrange(1,10,2))
#3随机匹配1-10之间的数,且步长为2

print(random.choice([1,2,'23',[1,2,3]]))
#[1, 2, 3]随机选择一个

print(random.sample([1,2,3,'34',[1,4,6]],2))
#[2, [1, 4, 6]]随机选择两个

  2.随机生成4位验证码

#a-z的ASCII码位97~122,A~Z的为65~90
import
random def code(): code='' for i in range(4): num=random.randint(0,9) zimu=chr(random.randint(65,90)) add=random.choice([num,zimu]) code=''.join([code,str(add)]) return code print(code())

  四. 序列化模块

            将数据类型转化为字符串就是序列化

  1.json(用于字符串 和 python数据类型间进行转换)

    四个语法(dumps,dump,loads,load)

    dumps和dump将数据类型序列化成字符串类型,而loads和load是反序列化

import json
dic={'k1':'v1','k2':'v2'}
str_dic=json.dumps(dic)
print(type(str_dic),str_dic)  #<class 'str'> {"k1": "v1", "k2": "v2"}

dit=json.loads(str_dic)
print(type(dit),dit)          #<class 'str'> {"k1": "v1", "k2": "v2"}

    dump和load应用再文件中

import json
f = open('xiaowu','w')
dic={'k1':'v1','k2':'v2'}
json.dump(dic,f)
f.close()

f=open('xiaowu')
a = json.load(f)
f.close()
print(a)

  2.pickle(用于python特有的类型 和 python的数据类型间进行转换)

         pickle.dumps将数据类型序列化bytes类型

import pickle

list=[1,2,3,4,5]
str_l=pickle.dumps(list)
print(type(str_l),str_l)     #<class 'bytes'> b'x80x03]qx00(Kx01Kx02Kx03Kx04Kx05e.'

b=pickle.loads(str_l)
print(b)                     #[1, 2, 3, 4, 5]

import pickle

f=open('xiaowu','wb')
a={1,2,3,4}
pickle.dump(a,f)
f.close()

f=open('xiaowu','rb')
a=pickle.load(f)
f.close()
print(a)
这里我们要说明一下,json是一种所有的语言都可以识别的数据结构。
如果我们将一个字典或者序列化成了一个json存在文件里,那么java代码或者js代码也可以拿来用。
但是如果我们用pickle进行序列化,其他语言就不能读懂这是什么了~
所以,如果你序列化的内容是列表或者字典,我们非常推荐你使用json模块
但如果出于某种原因你不得不序列化其他的数据类型,而未来你还会用python对这个数据进行反序列化的话,那么就可以使用pickle
 

   重要的内置模块hashlib

    Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等

    什么是摘要算法呢?摘要算法又称哈希算法、散列算法。它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。摘要算法就是通过    摘要函数f()对任意长度的数据data计算出固定长度的摘要digest,目的是为了发现原始数据是否被人篡改过。摘要算法之所以能指出数据是否被篡改过,就是因为摘要函数是一个单向函数,计算f(data)很容易,但通过digest反推data却非常困难。而且,对原始数据做一个bit的修改,都会导致计算出的摘要完全不同。我们以常见的摘要算法MD5为例,计算出一个字符串的MD5值:

import hashlib
md5 = hashlib.md5()
md5.update(b'Do you love me ? Yes,I do')
print(md5.hexdigest())

#49491115a4a3ce8574c8f1cd516c5030


#当一个字符串太长时,我们可以拆开调用update

import hashlib
md5 = hashlib.md5()
md5.update(b'Do you love me ? ')
md5.update(b'Yes,I do')
print(md5.hexdigest())

#49491115a4a3ce8574c8f1cd516c5030

MD5是最常见的摘要算法,速度很快,生成结果是固定的128 bit字节,通常用一个32位的16进制字符串表示。另一种常见的摘要算法是SHA1,调用SHA1和调用MD5完全类似:

import hashlib
sha1 = hashlib.sha1()
sha1.update(b'Do you love me ? ')
sha1.update(b'Yes,I do')
print(sha1.hexdigest())

#f0509b33f8d5847dde6708bbad19072a2f5f0090

SHA1的结果是160 bit字节,通常用一个40位的16进制字符串表示。比SHA1更安全的算法是SHA256和SHA512,不过越安全的算法越慢,而且摘要长度更长。

当我们的字符串太简单时,人家可以通过算法给我们计算出来,此时我们可以通过加盐算法让其复杂化
import hashlib
md5 = hashlib.md5('salt'.encode('utf-8'))
md5.update(b'Do you love me ? ')
md5.update(b'Yes,I do')
print(md5.hexdigest())


#0cc083aa89c4e8182ffaaa8fb0d7ba24

    logging模块(日志,用来记录用户行为或者代码的执行过程)

    两种配置方式:basicconfig和log对象配置方式,通常使用log对象方式

  函数式简单配置

import logging
logging.debug('debug message')
logging.info('info message')
logging.warning('warning message')
logging.error('error message')
logging.critical('critical message') 

默认情况下Python的logging模块将日志打印到了标准输出中,且只显示了大于等于WARNING级别的日志,这说明默认的日志级别设置为WARNING(日志级别等级CRITICAL > ERROR > WARNING > INFO > DEBUG),默认的日志格式为日志级别:Logger名称:用户输出消息

import logging
logging.basicConfig(level=logging.DEBUG,
                    format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',
                    datefmt='%a, %d %b %Y %H:%M:%S',
                    filename='/tmp/test.log',
                    filemode='w')

logging.debug('debug message')
logging.info('info message')
logging.warning('warning message')
logging.error('error message')
logging.critical('critical message')

  配置参数

logging.basicConfig()函数中可通过具体参数来更改logging模块默认行为,可用参数有:

filename:用指定的文件名创建FiledHandler,这样日志会被存储在指定的文件中。
filemode:文件打开方式,在指定了filename时使用这个参数,默认值为“a”还可指定为“w”。
format:指定handler使用的日志显示格式。
datefmt:指定日期时间格式。
level:设置rootlogger(后边会讲解具体概念)的日志级别
stream:用指定的stream创建StreamHandler。可以指定输出到sys.stderr,sys.stdout或者文件(f=open(‘test.log’,’w’)),默认为sys.stderr。若同时列出了filename和stream两个参数,则stream参数会被忽略。

format参数中可能用到的格式化串:
%(name)s Logger的名字
%(levelno)s 数字形式的日志级别
%(levelname)s 文本形式的日志级别
%(pathname)s 调用日志输出函数的模块的完整路径名,可能没有
%(filename)s 调用日志输出函数的模块的文件名
%(module)s 调用日志输出函数的模块名
%(funcName)s 调用日志输出函数的函数名
%(lineno)d 调用日志输出函数的语句所在的代码行
%(created)f 当前时间,用UNIX标准的表示时间的浮 点数表示
%(relativeCreated)d 输出日志信息时的,自Logger创建以 来的毫秒数
%(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
%(thread)d 线程ID。可能没有
%(threadName)s 线程名。可能没有
%(process)d 进程ID。可能没有
%(message)s用户输出的消息

  logger对象配置

import logging

logger = logging.getLogger()
# 创建一个handler,用于写入日志文件
fh = logging.FileHandler('test.log',encoding='utf-8') 

# 再创建一个handler,用于输出到控制台 
ch = logging.StreamHandler() 
formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
fh.setLevel(logging.DEBUG)

fh.setFormatter(formatter) 
ch.setFormatter(formatter) 
logger.addHandler(fh) #logger对象可以添加多个fh和ch对象 
logger.addHandler(ch) 

logger.debug('logger debug message') 
logger.info('logger info message') 
logger.warning('logger warning message') 
logger.error('logger error message') 
logger.critical('logger critical message')
原文地址:https://www.cnblogs.com/wm0217/p/10871908.html