常用模块

一. collections模块

　　1.namedtuple(用来表示坐标）

from collections import namedtuple

point=namedtuple('point',['x','y'])
p=point(1,2)
print(p.x)
print(p.y)




circle=namedtuple('circle',['x','y','r'])
c=circle(1,2,3)
print(c)

　　2.deque(deque是为了高效实现插入和删除操作的双向列表，适合用于队列和栈：)

from collections import deque

a=deque(['a','b','c'])
a.append('1')
a.appendleft('3')
print(a)



#deque(['3', 'a', 'b', 'c', '1'])

from collections import deque
q=deque(['a','b','c'])
print(q.pop())
print(q)
print(q.popleft())
print(q)




#c
#deque(['a', 'b'])
#a
#deque(['b'])

　　3.OrderedDict(可以保持key的顺序）

from collections import OrderedDict
d = OrderedDict([('a', 1), ('b', 2), ('c', 3)])
print(d)




#OrderedDict([('a', 1), ('b', 2), ('c', 3)])

　　4.defalutdict

　　有如下值集合 [11,22,33,44,55,66,77,88,99,90...]，将所有大于 66 的值保存至字典的第一个key中，将小于 66 的值保存至第二个key的值中。

values = [11, 22, 33,44,55,66,77,88,99,90]

my_dict = {}

for value in  values:
    if value>66:
        if 'k1' in my_dict:
            my_dict['k1'].append(value)
        else:
            my_dict['k1'] = [value]
    else:
        if 'k2' in my_dict:
            my_dict['k2'].append(value)
        else:
            my_dict['k2'] = [value]
print(my_dict)

from collections import defaultdict

values = [11, 22, 33,44,55,66,77,88,99,90]

my_dict = defaultdict(list)

for value in  values:
    if value>66:
        my_dict['k1'].append(value)
    else:
        my_dict['k2'].append(value)

二. 时间模块

import time
# print(time.time())   #时间戳
# print(time.strftime("%Y-%m-%d %H:%M:%S"))  #对应的当时时间字符串
# print(time.localtime())  #对应的当地的结构化时间
# print(time.gmtime())   #当时的伦敦当地时间


#将结构化时间转化为时间戳
# time_tuple = time.localtime(1500000000)
# ret = time.mktime(time_tuple)
# print(ret)


# #将结构化时间转化为字符串时间
print(time.strftime("%Y-%m-%d",time.localtime(1500000000)))

#字符串时间转化为结构化时间
ret=time.strptime("2017-03-16","%Y-%m-%d")
print(ret)

　　计算时间差

#将时间转化为时间戳
true_time=time.mktime(time.localtime(1600000000))
now_time=time.mktime(time.localtime())
#两者进行相减
dif_time=true_time-now_time
#将结果转化为伦敦时间
struct_time=time.gmtime(dif_time)
#再与1970年一月一日相减结果就是所求时间
print('还剩%d年%d月%d天%d小时%d分钟%d秒'%(struct_time.tm_year-1970,struct_time.tm_mon-1,
                                       struct_time.tm_mday-1,struct_time.tm_hour,
                                       struct_time.tm_min,struct_time.tm_sec))

三. random模块

import random

print(random.random())
#0.5397941284620414随机匹配0-1之间的数

print(random.randint(1,5))
#3随机匹配1-5之间的整数包括1和5

print(random.randrange(1,10,2))
#3随机匹配1-10之间的数，且步长为2

print(random.choice([1,2,'23',[1,2,3]]))
#[1, 2, 3]随机选择一个

print(random.sample([1,2,3,'34',[1,4,6]],2))
#[2, [1, 4, 6]]随机选择两个

　　2.随机生成4位验证码

#a-z的ASCII码位97~122，A~Z的为65~90
import random

def code():
    code=''
    for i in range(4):
        num=random.randint(0,9)
        zimu=chr(random.randint(65,90))
        add=random.choice([num,zimu])
        code=''.join([code,str(add)])
    return code
print(code())

　　四. 序列化模块

将数据类型转化为字符串就是序列化

　　1.json（用于字符串和 python数据类型间进行转换）

　　　　四个语法（dumps,dump,loads,load)

　　　　dumps和dump将数据类型序列化成字符串类型，而loads和load是反序列化

import json
dic={'k1':'v1','k2':'v2'}
str_dic=json.dumps(dic)
print(type(str_dic),str_dic)  #<class 'str'> {"k1": "v1", "k2": "v2"}

dit=json.loads(str_dic)
print(type(dit),dit)          #<class 'str'> {"k1": "v1", "k2": "v2"}

　　　　dump和load应用再文件中

import json
f = open('xiaowu','w')
dic={'k1':'v1','k2':'v2'}
json.dump(dic,f)
f.close()

f=open('xiaowu')
a = json.load(f)
f.close()
print(a)

　　2.pickle（用于python特有的类型和 python的数据类型间进行转换）

pickle.dumps将数据类型序列化bytes类型

import pickle

list=[1,2,3,4,5]
str_l=pickle.dumps(list)
print(type(str_l),str_l)     #<class 'bytes'> b'x80x03]qx00(Kx01Kx02Kx03Kx04Kx05e.'

b=pickle.loads(str_l)
print(b)                     #[1, 2, 3, 4, 5]

import pickle

f=open('xiaowu','wb')
a={1,2,3,4}
pickle.dump(a,f)
f.close()

f=open('xiaowu','rb')
a=pickle.load(f)
f.close()
print(a)

这里我们要说明一下，json是一种所有的语言都可以识别的数据结构。
如果我们将一个字典或者序列化成了一个json存在文件里，那么java代码或者js代码也可以拿来用。
但是如果我们用pickle进行序列化，其他语言就不能读懂这是什么了～
所以，如果你序列化的内容是列表或者字典，我们非常推荐你使用json模块
但如果出于某种原因你不得不序列化其他的数据类型，而未来你还会用python对这个数据进行反序列化的话，那么就可以使用pickle

　　重要的内置模块hashlib

　　　　Python的hashlib提供了常见的摘要算法，如MD5，SHA1等等

　　　　什么是摘要算法呢？摘要算法又称哈希算法、散列算法。它通过一个函数，把任意长度的数据转换为一个长度固定的数据串（通常用16进制的字符串表示）。摘要算法就是通过　　　　摘要函数f()对任意长度的数据data计算出固定长度的摘要digest，目的是为了发现原始数据是否被人篡改过。摘要算法之所以能指出数据是否被篡改过，就是因为摘要函数是一个单向函数，计算f(data)很容易，但通过digest反推data却非常困难。而且，对原始数据做一个bit的修改，都会导致计算出的摘要完全不同。我们以常见的摘要算法MD5为例，计算出一个字符串的MD5值：

import hashlib
md5 = hashlib.md5()
md5.update(b'Do you love me ? Yes,I do')
print(md5.hexdigest())

#49491115a4a3ce8574c8f1cd516c5030


#当一个字符串太长时，我们可以拆开调用update

import hashlib
md5 = hashlib.md5()
md5.update(b'Do you love me ? ')
md5.update(b'Yes,I do')
print(md5.hexdigest())

#49491115a4a3ce8574c8f1cd516c5030

MD5是最常见的摘要算法，速度很快，生成结果是固定的128 bit字节，通常用一个32位的16进制字符串表示。另一种常见的摘要算法是SHA1，调用SHA1和调用MD5完全类似：

import hashlib
sha1 = hashlib.sha1()
sha1.update(b'Do you love me ? ')
sha1.update(b'Yes,I do')
print(sha1.hexdigest())

#f0509b33f8d5847dde6708bbad19072a2f5f0090

SHA1的结果是160 bit字节，通常用一个40位的16进制字符串表示。比SHA1更安全的算法是SHA256和SHA512，不过越安全的算法越慢，而且摘要长度更长。

当我们的字符串太简单时，人家可以通过算法给我们计算出来，此时我们可以通过加盐算法让其复杂化

import hashlib
md5 = hashlib.md5('salt'.encode('utf-8'))
md5.update(b'Do you love me ? ')
md5.update(b'Yes,I do')
print(md5.hexdigest())


#0cc083aa89c4e8182ffaaa8fb0d7ba24

　　　　logging模块（日志，用来记录用户行为或者代码的执行过程）

　　　　两种配置方式：basicconfig和log对象配置方式，通常使用log对象方式

　　函数式简单配置

import logging
logging.debug('debug message')
logging.info('info message')
logging.warning('warning message')
logging.error('error message')
logging.critical('critical message')

默认情况下Python的logging模块将日志打印到了标准输出中，且只显示了大于等于WARNING级别的日志，这说明默认的日志级别设置为WARNING（日志级别等级CRITICAL > ERROR > WARNING > INFO > DEBUG），默认的日志格式为日志级别：Logger名称：用户输出消息

import logging
logging.basicConfig(level=logging.DEBUG,
                    format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',
                    datefmt='%a, %d %b %Y %H:%M:%S',
                    filename='/tmp/test.log',
                    filemode='w')

logging.debug('debug message')
logging.info('info message')
logging.warning('warning message')
logging.error('error message')
logging.critical('critical message')

　　配置参数

logging.basicConfig()函数中可通过具体参数来更改logging模块默认行为，可用参数有：

filename：用指定的文件名创建FiledHandler，这样日志会被存储在指定的文件中。
filemode：文件打开方式，在指定了filename时使用这个参数，默认值为“a”还可指定为“w”。
format：指定handler使用的日志显示格式。
datefmt：指定日期时间格式。
level：设置rootlogger（后边会讲解具体概念）的日志级别
stream：用指定的stream创建StreamHandler。可以指定输出到sys.stderr,sys.stdout或者文件(f=open(‘test.log’,’w’))，默认为sys.stderr。若同时列出了filename和stream两个参数，则stream参数会被忽略。

format参数中可能用到的格式化串：
%(name)s Logger的名字
%(levelno)s 数字形式的日志级别
%(levelname)s 文本形式的日志级别
%(pathname)s 调用日志输出函数的模块的完整路径名，可能没有
%(filename)s 调用日志输出函数的模块的文件名
%(module)s 调用日志输出函数的模块名
%(funcName)s 调用日志输出函数的函数名
%(lineno)d 调用日志输出函数的语句所在的代码行
%(created)f 当前时间，用UNIX标准的表示时间的浮 点数表示
%(relativeCreated)d 输出日志信息时的，自Logger创建以 来的毫秒数
%(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
%(thread)d 线程ID。可能没有
%(threadName)s 线程名。可能没有
%(process)d 进程ID。可能没有
%(message)s用户输出的消息

　　logger对象配置

import logging

logger = logging.getLogger()
# 创建一个handler，用于写入日志文件
fh = logging.FileHandler('test.log',encoding='utf-8') 

# 再创建一个handler，用于输出到控制台 
ch = logging.StreamHandler() 
formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
fh.setLevel(logging.DEBUG)

fh.setFormatter(formatter) 
ch.setFormatter(formatter) 
logger.addHandler(fh) #logger对象可以添加多个fh和ch对象 
logger.addHandler(ch) 

logger.debug('logger debug message') 
logger.info('logger info message') 
logger.warning('logger warning message') 
logger.error('logger error message') 
logger.critical('logger critical message')