Python学习笔记

模块与包

一个模块就是一个包含了Python定义和声明的文件，文件名就是模块名加上.py的后缀，导入一个py文件，解释器解释该py文件，导入一个包，解释器解释该包下的 __init__.py 文件，所以如果我们要创建一个包文件，那么该文件下必须要有__init__.py文件。

包

从目录级别来组织模块的，本质上也是被导入的，目录下有 __init__ 文件的都可以理解为包，在import时，其实导入的就是包下的 __init__.py 文件。

无论是import形式，还是from...import形似，凡是在导入语句中（而不是使用时）遇到带点的，就是在导入包
包是目录级的（文件夹），文件夹是用来组织py文件的。（包的本质就是一个包含 __init__.py 文件的目录）
import导入文件时，产生的名称空间来源于文件，import包，产生的命名空间同样来源于文件，既包下面的__init__.py,导入包的本质就是导入该文件

包的import *

这个* 其实读取的就是 __init__ 文件里面的所有函数，所以一般不要用*
通过在父包内的__init__文件中利用相对路径进行导入子包的模块或者方法，来达到通过（父包.方法）来调用，屏蔽了不同子包路径过长的问题

模块

要想使用模块需要先行倒入，那么根据导入方式的不同主要有两种方式：import 和 from。

import导入

导入操作：
　　1）import导入模块就会执行要导入的模块的所有代码
　　2）产生新的名称空间
　　3）拿到一个模块名，指向模块中的代码
语法：

import module as alias  # 导入时并定义别名
import module,module1,module2  # 一次导入多个模块(不建议)

调用方式：使用包名.函数名来执行导入的函数

import time
print(time.strftime('%Y-%m-%d %H:%M:%S'))

# 导入time模块
# 使用 time.strftime()来调用strftime()函数

注意：使用import方式会导入包中的所有函数。

from导入　　　　　　

导入操作：
　　1）会执行要导入的模块的所有代码,调用时只通过func就可以调用
　　2）如果func和本文件中存在同名func，那么就会覆盖
语法：

from module import func  # 调用时可以直接使用func,而不必使用module.func来调用
from module import * # 导入所有函数

PS：在被导入模块的__init__.py文件中定义__all__ = ['module','module1']，这样在导入其时，用*,只能导入 __all__ 定义的模块

调用方式：直接使用函数名进行调用。　

from time import strftime
print(strftime('%Y-%m-%d %H:%M:%S'))

PS：func来自哪个文件，那么func内部调用的变量，以其所在文件中的环境变量为准

模块中的特殊关键字及路径

模块文件中有一些Python提供的特殊关键字，例如
__file__ :打印当前文件的文件名
__name__ :显示当前模块是否被导入，显示：__main__ 表示没有被导入，显示：模块名，表示被此模块被导入。
PS：如果我们写的Python文件中的某个函数或者类会被其他人调用，使用if __name__ == '__main__' ,后面写主逻辑，这样在别的地方导入，就不会执行下面的代码段，而直接运行文件时，就会执行。

模块路径　　　　　　

顾名思义，导入模块是需要先找到该模块，和在linux中执行命令是相同的，在Python中导入模块的搜索顺序：

先从内存中寻找
然后在内置模块中寻找
然后在sys.path中查找

关于sys.path，类似于shell中的PATH，其是list类型，每个元素为路径的字符串形式，列表的第一个路径默认为当前路径，使用sys.path.append('dirpath')，就可以把路径加入到sys.path中

Python内置模块

Python中内置了很多模块，可以提供很多实用的功能，下面将会列举部分模块。

datetime模块

提供时间功能的模块其实不止datetime，Python内置的还有一个time模块，time模块可以完成格式化输出，但是用起来没有datetime模块方便，但在下面场景下会用到time模块

import time
for i in range(1,10):
    print(i)
    time.sleep(1)     # 类似于Linux中的sleep命令。

获取当前日期和时间

datetime.now() 格式化输出一个datetime.datetime对象，打印则显示当前时间

from datetime import datetime
print(type(datetime.now()))
print(datetime.now())

注意到datetime是模块，datetime模块还包含一个datetime类，通过from datetime import datetime导入的才是datetime这个类，如果仅导入import datetime，则必须引用全名datetime.datetime.now()。

获取指定的日期与时间

通过是datetime对象实例化的时候，传入指定的时间参数，来获取指定的日期与时间的时间格式字符。

from datetime import  datetime

timer = datetime(2017,11,9,11,20)
print(timer)

注意：时间日期如果是个位数，不能手动补0，比如9可以，09就不行。

获取时间戳

在计算机中，时间实际上是用数字表示的。我们把1970年1月1日 00:00:00 UTC+00:00时区的时刻称为epoch time(元时间)，记为0（1970年以前的时间timestamp为负数），当前时间就是相对于epoch time的秒数，称为timestamp(时间戳)。

所以针对于元时间来说：timestamp = 0 = 1970-1-1 00:00:00 UTC+0:00
对应的北京时间是：timestamp = 0 = 1970-1-1 08:00:00 UTC+8:00（因为北京属于东八区）

可见timestamp的值与时区毫无关系，因为timestamp一旦确定，其UTC时间就确定了，转换到任意时区的时间也是完全确定的，这就是为什么计算机存储的当前时间是以timestamp表示的，因为全球各地的计算机在任意时刻的timestamp都是完全相同的（假定时间已校准）。

from datetime import datetime

print(datetime.now().timestamp())

# 注意 timestamp()，方法可以作用在datetime.datetime对象上。 （datetime(2017,11,9,11,50）因为返回的是datetime.datetime对象，所以也可以使用timestamp()来转换)

时间戳转换为格式化时间

要把timestamp转换为datetime，使用datetime提供的fromtimestamp()方法：

from datetime import datetime
t = datetime.now().timestamp()
print(t)
t2 = datetime.fromtimestamp(t)
print(t2)

注意到timestamp是一个浮点数，它没有时区的概念，而datetime是有时区的。上述转换是在timestamp和本地时间做转换。如果我们计算机本地时间为 UTC +8，那么获得的时间就是基于本地UTC时间的。

获取前几个小时或后几天

获取前几个小时或后几天，其实是对日期和时间进行加减，得到新的datetime。加减可以直接用+和-运算符，不过需要导入timedelta这个类：

from datetime import  datetime,timedelta

now = datetime.now()

timer = now - timedelta(hours=10)

print(timer)

# timedelta 默认为天，其他参数还有 days，hours，minutes等。
# 传递的参数可以为负数

datetime对象转换为字符串时间

如果已经有了datetime对象，要把它格式化为一个特定的字符串显示给用户，就需要转换为str，转换方法是通过strftime()实现的，同样需要一个日期和时间的格式化字符串：

from datetime import  datetime

str_time = datetime.now().strftime('%Y-%M-%d %H:%M:%S')

print(str_time)

字符串时间转换为datetime对象

很多时候，用户输入的日期和时间是字符串，要处理日期和时间，首先必须把str转换为datetime。转换方法是通过datetime.strptime()实现，需要一个日期和时间的格式化字符串：‘

from datetime import datetime

str_time = '2017-11-09 17:15:48'

date_time = datetime.strptime(str_time,'%Y-%m-%d %H:%M:%S')
print(date_time)

logging模块

logging模块用于日志的打印记录等，是一个健壮的Python程序所必须具有的模块。

logging模块支持的日志级别主要有五种：DEBUG,INFO,WARNING,ERROR,CRITICAL。优先级为：CRITICAL > ERROR > WARNING > INFO > DEBUG 。默认的级别为WARNING。Python只会打印比当前级别高的日志，比如我同时刷出了INFO和ERROR级别的日志，如果我的日志级别设置的为WAIRNING，那么只会打印ERROR的日志。

基本使用

引入logging模块，通过logging.级别来输出日志信息

import logging

logging.debug('debug level message')
logging.info('info level message')
logging.warning('warning level message')
logging.error('error level message')
logging.critical('crtical level message')

注意：由于默认级别为WARNING，所以上面的例子只会打印WARNING、ERROR、CRITICAL输出的信息

定义日志格式并输出到文件

logging提供了基础的日志模版，可以定义日志的输出格式，以及输出位置

import logging


logging.basicConfig(level=logging.DEBUG,
                    format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',
                    datefmt='%Y-%m-%d %H:%M:%S',
                    filename='log.log',
                    filemode='w')

logging.debug('debug level message')
logging.info('info level message')
logging.warning('warning level message')
logging.error('error level message')
logging.critical('crtical level message')

basicConfig支持的参数含义为：

level：为日志级别，可选参数有logging.DEBUG,logging.INFO,logging.WARNING,logging.ERROR,logging.CRITICAL，分别对应logging的五种日志级别。
filename: 表示日志文件的名称及路径。
filemode：表示日志文件的打开模式，默认不指定的情况下为a，可以改为w。
datefmt：对时间进行格式定制，和时间的格式化字符是相同的。
format：对日志格式进行定义。

 1 %(name)s  # Logger的名字
 2 %(levelno)s  # 数字形式的日志级别
 3 %(levelname)s # 文本形式的日志级别
 4 %(pathname)s # 调用日志输出函数的模块的完整路径名，可能没有
 5 %(filename)s # 调用日志输出函数的模块的文件名
 6 %(module)s # 调用日志输出函数的模块名
 7 %(funcName)s # 调用日志输出函数的函数名
 8 %(lineno)d # 调用日志输出函数的语句所在的代码行
 9 %(created)f # 当前时间，用UNIX标准的表示时间的浮 点数表示
10 %(relativeCreated)d # 输出日志信息时的，自Logger创建以 来的毫秒数
11 %(asctime)s # 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
12 %(thread)d # 线程ID。可能没有
13 %(threadName)s # 线程名。可能没有
14 %(process)d # 进程ID。可能没有
15 %(message)s # 用户输出的消息

format支持的日志格式

当然logging还有更多灵活的模块：logger,handler,filter,formatter。参考：http://www.jb51.net/article/88449.htm

多模块利用logging记录日志

我们可以把logging写到一个模块中，然后在需要记录的地方，导入模块，记录信息即可。

# writelog模块：
import logging

logging.basicConfig(level=logging.WARNING,
                    format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',
                    datefmt='%Y-%m-%d %H:%M:%S',
                    filename='log.log',
                    filemode='a')




# 需要记录日志的py文件
import writelog

writelog.logging.debug('debug level message')
writelog.logging.info('info level message')
writelog.logging.warning('warning level message')
writelog.logging.error('error level message')
writelog.logging.critical('crtical level message')

OS模块　

OS模块简单的来说它是一个Python的系统编程的操作模块，可以处理文件和目录这些我们日常手动需要做的操作，和所在的操作系统版本无关。

查看OS模块的帮助文档

>>> import os  # 导入os模块
>>> help(os)   # 查看os模块帮助文档，里面详细的模块相关函数和使用方法

常用功能介绍　

os模块中提供了特别多的和系统相关的操作功能，这里列举一些常用功能

os.getcwd()   # 获取当前路径
os.chdir()  # 切换当前目录，当路径中存在的时候，由于是转意的意思，那么就需要对进行转意，那么路径就是c:\User,或者在目录前面加r，表示后面的字符串不进行解释
os.curdir()  # 获取当前目录名
os.pardir()  # 获取上级目录名
os.mkdir('dir')  # 创建目录，注意只能创建一级目录
os.makedirs('dir_path')  # 创建多级目录
os.rmdir('dir')  # 删除一个目录
os.removedir('dir_path')  # 删除多级目录（目录为空的话）
os.listdir('dir')  # 显示目录下的所有文件,默认为当前目录,返回的结果为list
os.remove('file')  # 删除一个文件
os.rename('old_name','new_name')  # 修改文件名称
os.stat('file/dir')  # 获取文件/目录的stat信息
os.sep  # 返回当前操作系统的路径分隔符
# Windows下：\ , Linux下:/
os.linesep  # 返回当前操作系统的换行符
# Windows下:
  ,Linux下:

os.pathsep  # 返回当前操作系统环境变量分隔符
# Windows下：;   ,   Linux下： :
os.name  # 返回当前系统的类型
# nt 表示Windows,  posix表示Linux
os.system('Commmand')  # 执行命令
os.environ  # 获取系统环境变量，使用字典存储
os.path.abspath('dir/file')  # 获取dir/file的绝对路径
os.path.split('path')  # 把路径分割为目录和文件名组成的元组格式，不管path是否存在
os.dirname('path')  # 获取文件的父目录名称，不管path是否存在
os.basename('path')  # 获取文件的名称，不管path是否存在
os.path.exists('path')  # 判断path是否存在,return bool
os.path.isabs('path')  # 判断path是否是从根开始,return bool
# Linux下：从/开始    Windows下从C,D,E盘开始
os.path.isfile('path')  # 判断path是否是一个文件
os.path.isdir('path')  # 判断path是否是一个目录
os.path.join('path1','path2')  # 把path1和path2进行组合
os.path.getatime('path')  # 获取文件的atime时间，返回时间戳
os.path.getmtime('path')  # 获取文件的mtime时间，返回时间戳
os.path.getsize('name')  # 获取文件的大小

commands模块

commands模块专门用于调用Linux shell命令，并返回状态和结果，和os的popen功能类似，该模块一共有三个函数：getoutput,getstatus,getstatusoutput

commands.getoutput('Linux shell command')   # 执行Linux shell命令，并获取命令执行的结果
commands.getstatus('filename')    # 传递filename，执行 'ls -ld  filename' 的命令。
commands.getstatusoutput('Linux shell command')   # 执行Linux shell命令，返回的是一个元组.。（命令返回code，结果）

实例：

>>> import commands
>>> commands.getoutput('who')
'DahlHin  console  Nov  9 09:38 
DahlHin  ttys000  Nov 10 10:30 '
>>> commands.getstatus('.pip')
'drwxr-xr-x  3 DahlHin  staff  96 10 21 21:44 .pip'
>>> commands.getstatusoutput('asasas')
(32512, 'sh: asasas: command not found')
>>>

注意：commands模块在Python 3.x中已经被subprocess替代！

sys模块

sys模块负责程序与python解释器的交互，提供了一系列的函数和变量，用于操控python的运行时环境。

常用函数：

sys.path # 列出当前Python环境变量，也就是导入时模块的搜索路径
sys.argv # 类似于shell脚本的$1 $2 ，用于传递命令行参数，使用列表进行传递
sys.stdout.write(‘#’) # 在屏幕上输出，但是不换行，配合for循环，比较适合用来做进度条等
sys.stdout.flush() # 配合sys.stdout.write使用，把每次输出的信息，强制刷新到屏幕上，达到动态的效果

1 import sys,time
2 for i in range(20):
3     sys.stdout.write('=')
4     sys.stdout.flush()
5     time.sleep(1)

进度条的动态效果

注意：我们可以把自己写的一些模块加到Python环境变量中去，由于sys.path是list类型，所以只需要append('path')，就可以完成添加。

 1 sys.modules.keys() # 返回所有已经导入的模块列表
 2 sys.exc_info()  # 获取当前正在处理的异常类,exc_type、exc_value、exc_traceback当前处理的异常详细信息
 3 sys.exit(n)  # 退出程序，正常退出时exit(0)
 4 sys.hexversion  # 获取Python解释程序的版本值，16进制格式如：0x020403F0
 5 sys.version  # 获取Python解释程序的版本信息
 6 sys.maxint  # 最大的Int值
 7 sys.maxunicode  # 最大的Unicode值
 8 sys.modules  # 返回系统导入的模块字段，key是模块名，value是模块
 9 sys.platform # 返回操作系统平台名称
10 sys.stdout  # 标准输出
11 sys.stdin  # 标准输入
12 sys.stderr  # 错误输出
13 sys.exc_clear()  # 用来清除当前线程所出现的当前的或最近的错误信息
14 sys.exec_prefix  # 返回平台独立的python文件安装的位置
15 sys.byteorder  # 本地字节规则的指示器，big-endian平台的值是'big',little-endian平台的值是'little'
16 sys.copyright  # 记录python版权相关的东西
17 sys.api_version  # 解释器的C的API版本

其他的sys模块函数

json&pickle模块

json和pickle模块是用来做序列化的，为什么要序列化？序列化可以持久保存状态，还可以跨平台数据交互。

如何序列化？可以使用json或者pickle模块

json(跨平台) 支持字典(dict)、列表(list)、字符串(str)、整型浮点型(int/float)、bool(True,False),null(None)。
pickle(纯Python)，可以序列化存储python所有的对象，甚至是一个函数，但是只能和Python程序进行交互，其他凭他不支持。

eval不能识别非Python语法的数据类型，所以很多时候要用json

json

json支持跨平台的序列化存储以及反序列化读取。

序列化：dump,dumps
反序列化：load,loads

1 # json.dumps 表示序列化，会返回一个序列化后的对象。
2 
3 import json
4 
5 a = [1,2,3,4]
6 
7 b = json.dumps(a)
8 
9 print(type(b))

json.dumps

 1 # json.dump 表示序列化存储到文件中去
 2 
 3 import json
 4 
 5 a = [1,2,3,4,5]
 6 
 7 with open('log.log','w') as f:
 8     json.dump(a,f)
 9 
10 
11 # dump 需要两个参数，持久化的存储的对象，第二个是一个可写的文件描述符。

json.dump

 1 # json.loads 从json字符串反序列化为对象
 2 import json
 3 
 4 a =  '[1, 2, 3, 4]'
 5 
 6 print(type(a))
 7 
 8 b = json.loads(a)
 9 
10 print(type(b))
11 
12 print(b)

json.loads

1 # json.load 从文件中反序列化为对象
2 import json
3 
4 with open('hello.txt','r') as f:
5     b = json.load(f)
6 
7 print(b)

json.load

pickle

pickle仅python支持，在序列化到文件中的时候没需要用b模式打开才可以。

序列化：dump,dumps
反序列化：load,loads

 1 # pickle.dumps 把对象序列化为bytes格式数据
 2 import pickle
 3 
 4 a = {
 5     'name':'daxin',
 6     'age':18,
 7     'job':'Linux'
 8 }
 9 
10 b = pickle.dumps(a)
11 print(b)
12 print(type(b))

pickle.dumps

 1 # pickle.dump 序列化到文件中
 2 import pickle
 3 
 4 a = {
 5     'name':'daxin',
 6     'age':18,
 7     'job':'Linux'
 8 }
 9 
10 with open('hello.txt','wb') as f:
11     pickle.dump(a,f)

pickle.dump

1 # pickle.loads 把bytes对象反序列化
2 import pickle
3 
4 b = b'x80x03}qx00(Xx04x00x00x00nameqx01Xx05x00x00x00daxinqx02Xx03x00x00x00ageqx03Kx12Xx03x00x00x00jobqx04Xx05x00x00x00Linuxqx05u.'
5 
6 a = pickle.loads(b)
7 
8 print(a)

pickle.loads

1 # pickle.load 从文件中反序列化
2 import pickle
3 
4 with open('hello.txt','rb') as f:
5     a = pickle.load(f)
6 
7 print(a)

pickle.load

注意：

　　json序列化后的对象类型为str，pickle序列化后的对象类型为bytes，所以pickle序列化/反序列化时对文件的操作需要用b模式。

备份一个好用的json转换网站：https://www.json.cn/

random模块

顾名思义，用来产生随机数的模块，它有如下几个常用的方法

random.randint(a,b)         # 在a,b之间随机选出一个数(包含a,b本身)
random.randrange(a,b,step)  # 这里和range的使用方法是相同的
random.choice(iterable)     # 在一个可迭代对象中随机选择
random.shuffle(seq)         # 原地对序列进行洗牌(随机打乱)