进阶篇知识点

前言

1. virtualenv的使用

virtualenv作用是并行管理多个python程序，解决因多个python版本不兼容的问题

使用方法如下

1）安装pip: apt install pip

2）安装virtualenv：pip install virtualenv

3）建立工作目录：virtualenv test1

4）在工作目录下安装文件：cd test1, source bin/activate, pip install tornado

2. 推荐参考书

1）程序员的数学

2）大话数据结构，大话设计模式（后期再看）

3）C语言

4）python标准库

5) python基础教程

6）官方文档 docs.python.org

一，函数

进阶篇函数第一节

1.函数基本概念

注意点：

a: 输出函数时要加小括号

b: 函数中的return语句非常重要

c: 函数体为空的话，这里要写一个pass

def func_name():

pass# 函数体为空的话，这里要写一个pass，如果不写，函数是不成立的，

输出函数时要加小括号

def func1():

return "hello,world"

print func1()

错误例子1

print "a>b" if a>b else pass 执行的时候会报错，其实这个三元表达式是执行2个命令，print 和后面的条件语句，如果a>b 会执行print "a>b", 否则，会执行print pass，但是这个pass是一个命令体中的语句，结果就会报错，最好写成如下

if a>b:

print "a>b"

else:

pass

错误例子2

def func2():

print 123

test = func2()

print type(test)

输出结果是nonetype，所以函数中的return语句非常重要。

2.参数 <=> 抽象

例如

def add(num1,num2)：

return num1+num2

print add(1,3)

print add(3,8)

3.参数分为可选参数，必选参数

1）计算不定数量的整数相加

def add(*num): #这里*会把num定义为一个tuple类型，2个*会定义为字典类型

d = 0

for i in num:

d += i

return d

print add(1,2,3,4,5)

print add(1,2,3)

print add(2,4,6,8,1,2,3,4,12312,12314,123,123,123)

2）可选和必选语法上的区别

1.可选参数是有默认值的

2.必须参数是没有默认值的

默认值和没有默认值的区别在于 “=”

例如

def add(num1,num2=4)

return num1+num2

print add(1)

如果参数中的"=4"没有的话，调用add函数的时候就需要写2个参数，如果定义函数的时候，2个参数都有等号，那么调用的时候直接用print add()就行

3）函数的健壮性--考虑到大部分结果，并得到应急反馈处理。

1）各种情况下会返回什么东西（异常处理，条件判断）

2）自定义你想要的返回结果

def add(num1 ,num2):

if isinstance(num1,int) and isinstance(num2, int):

return num1+num2

else:

return '参数里有不是数字的类型'

print add('a',(1,2,3))

print add(1,2)

测试方法，断言

assert add(1,2) == 3

assert add(2,4) == 3

在这里，如果断言正确，不会输出任何信息，如果断言错误，就会返回AssertionError

二，函数第2节

1.元组，list，字典都能迭代，int和string不能迭代

2. 怎么去学习使用函数

（1）别管那么多复杂的，先直接把功能实现了。

（2）抽象成函数：命名规范，伪代码,参数默认值。

（3）将函数变得更健壮，让它可以跑很多地方

1.假设你写的函数是要交给你的基友用 -》功能完整

2.假设你写的函数是要交给你的学弟用 -》异常处理完善

(4) 测试

1.assert

2.对函数的返回进行一个值和类型的测试。

3.单元测试

def func1(a,b,c,d,e):

“”“

@a:

”“”

pass

3. 命名

下划线命名线 get_doc

驼峰命名法 getDocFromUrl

为什么要用默认值：

1.更省事

2.更可配置

4.练习题

三. 函数第3节

1. assert

在开发一个程序时候，与其让它运行时崩溃，不如在它出现错误条件时就崩溃（返回错误）。这时候断言assert就显得非常有用。

assert不能放在程序流程中，它是用于程序调试的

例1. 下面使用assert的方式是不对的

for item in args:

assert isinstance(item,int),'parameter is integer only'

return max(args),min(args)

例2

这段代码用来检测数据类型的断言，因为 a_str 是 str 类型，所以认为它是 int 类型肯定会引发错误。

>>> a_str = 'this is a string'

>>> type(a_str)

>>> assert type(a_str)== str

>>> assert type(a_str)== int

Traceback (most recent call last):

File "<pyshell#41>", line 1, in <module>

assert type(a_str)== int

AssertionError

2.自省与函数---func.__code__

例如

def func1(arg1,arg2):

return arg1 == arg2

print dir(func1.__code__)

print func1.__code__.co_varnames #('arg1', 'arg2')，返回函数的参数

print func1.__code__.co_filename #test1.py，返回脚本的文件名。

print help(func1.__code__)

都试一下会输出什么

3.作用域问题再议

例子1

arg = 1

def func1():

arg = 3

func1()

print arg

返回结果是1，说明局部变量只会在函数内部生效。

例子2

arg =1

def func1():

global arg

arg = 3

def func2():

global arg

arg =4

func2()

func1()

print arg

结论：

1) func2()和func1()的顺序不同，输出结果也会不同

2) global关键字可以把局部变量变为全局变量

4.可变参数的魔法与禁忌

例子1

def func1(arg):

arg[0] = 5 用于测试

return arg

print func1([1,2,3])

结果为[5,3,4]，参数arg为列表，是可变的参数。

例子2

def func1(arg):

arg[0] = 5 用于测试

return arg

tlist = [1,2,3]

print func1(tlist)

print tlist #引入可变参数会很危险，这里引入的tlist参数自己也被修改了

四. 函数第4节

step1:lambda之再议

1.lambda是一个表达式,它没有名称，存储的也不是代码块，而是表达式。

2.它被用作执行很小的功能，不能在里面使用条件语句。但是可以执行三元表达式，比如例2

3.也可以执行列表推导式，比如例子3

例子1

d = lambda x:x+1

print d(2)

输出为3,等价于函数

def e(x)

return x+1

例子2

>>> d = lambda x:x+1 if x>0 else "error"

>>> print d(3)

>>> print d(-1)

error

例子3

>>> g = lambda x:[(x,i) for i in xrange(0,10)]

>>> print g(3)

[(3, 0), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (3, 7), (3, 8), (3, 9)]

例子4

>>> t = [1,2,3,4,5]

>>> g = filter(lambda x:x>3,t) #自动把t的值代入x中

>>> print g

[4, 5]

step2:函数参数总结

1.位置匹配 func(name)

def func(arg1,arg2,arg3):

return arg1,arg2,arg3

print func(1,2,3) #按位置传参

2.关键字匹配 func(key=value)

def test(a='',b='None',c=''):

return a,b,c

print test(a=2,c=3)

print test(c=9,a=1)

print test(a=3,b=4,c=5)

print test()

输出结果如下

(2, 'None', 3)

(1, 'None', 9) #说明参数顺序变化也没关系

(3, 4, 5)

('', 'None', '')

3.收集匹配

如果是在参数中没有定义的位置参数，就会设为元组或者字典;

*kargs 元组

**kw 字典

例子

def func2(a,*kargs,**kw):#比较有位置参数a和没有的区别

return kargs

print func2(2,3,4,5,[1,2,3],{1:2,3:4})

4.参数顺序

参数位置规则：位置匹配参数 > 关键字匹配参数 > 元组参数 > 字典参数；比如def func2(a,d,b=4,*kargs,**kw)

step3:接触递归

1.递归是调用自身

2.理解下面的函数

"""

def func(i):

if i<100:

return i + func(i+1)

return i

print func(3)

print func(10)

"""

五. 面向对象

初识class

1. class的基本定义

class test(object):

a=1 #a称为test的属性

def func_1(self): #在类中定义的函数被称为方法，方法的第一个参数必须是self。

pass

t = test()

print t.a

print t.func_1()

2. __init__方法-------构造函数，

作用：实例化之前可以先引入一些必要的参数

例子1：定义一个空方法

def __init__(self):

pass

例子2：

class Person: #类名后面不加参数也行

def __init__(self,name,age):

self.name=''

self.age=0

p=person('tom',20)

print p

这样的输出结果是

hong@hong-VirtualBox:~$ python test2.py

<__main__.person instance at 0x7f5f8104c560>

例子3：将对象的内容打印出来

class test(object): #所有的class都是object的派生类

def __init__(self,var1): #注意这里的逗号

self.var1 = var1 #把参数var1赋值给self.var1,这样self.var1就能在类中进行全局调用

def get(self,a=None): #把参数a去掉和a=None是等效的，这样就不用引入参数了

return self.var1 #全局调用self.var1，一般的函数是不能使用在其他函数中的变量的

t = test("hello,my name is hong")

print t.get()

例子4：用于生成对象的字符串表示的方法__str__

class test:

def __init__(self,var1):

self.var1 = var1

def get(self,a=None):

return self.var1

def __str__(self):

return self.var1

t = test("hello, my name is hong")

print t.get()

print type(t.get())

print str(t)

print type(str(t))

输出如下

hello, my name is hong

hello, my name is hong

注意：这里get方法和__str__方法是等效的。

例子5：把上例改成2个参数

class test:

def __init__(self,var1,var2):

self.var1 = var1

self.var2 = var2

def get(self):

return self.var1,self.var2

def __str__(self):

return self.var1,self.var2

t = test("hello",33)

print t.get()

print str(t)

这样写会返回一个错误

hong@hong-VirtualBox:~$ python test2.py

('hello', 33)

Traceback (most recent call last):

File "test2.py", line 13, in <module>

print str(t)

TypeError: __str__ returned non-string (type tuple)

改成如下代码就对了，自己琢磨一下

class test:

def __init__(self,var1,var2):

self.var1 = var1

self.var2 = var2

def get(self):

return self.var1,self.var2

def __str__(self):

return "(%s,%d)" % (self.var1,self.var2)

t = test("hello",33)

print t.get()

print type(t.get())

print str(t)

print type(str(t))

输出结果如下

hong@hong-VirtualBox:~$ python test2.py

('hello', 33)

(hello,33)

3. 析构函数,是用作销毁的，这种方法不常用，因为class被销毁时，python有内部机制会自动销毁里面的数据。

def __del__(self):

del self.arg1

del self.arg2

t = test(1,4)

print t.a

print t.func_1()

4. class和函数的区别

例子1：一个最基本的对象

class test(object):#如果是空类，可以继承object类

def get(self): #类里面定义函数，其中的参数self代表的是对象本身，可以在class内部全局调用

return "hello"

对比一下，定义一个基本函数

def get():

return "hello"

t = test() #t是test的一个实例

print t.get() #get称为test对象的专属方法，不能被其他函数调用，这个就是使用对象的内置方法

print get() #自定义的函数和对象的内置方法进行对比

例2. 在get()函数中增加一个参数a

class test(object):

def get(self,a): #引入一个参数a，

return a

def got(a): #自定义的函数也引入一个参数a

return a

t = test()

new_var = 4

print t.get(new_var)

print got(new_var)

输出都是4

5. 私有变量

再person中，在变量名age开头加上2个下划线，表明age是私有变量，这样age只能person类中访问；不以下划线打头的变量是公有变量，任何代码都可访问他们。

在编写大型程序时，一条实用的经验规则是，首先将所有对象变量都设置为私有的（即以2个下划线打头），再在有充分理由的情况下将其改为公有的，可以避免无意间修改对象内部变量导致的错误。

6. __repr__和__str__的区别

class Test(object):

def __init__(self, value='hello, world!'):

self.data = value #这里说明并非一定写成self.value=value

>>> t = Test()

>>> t

<__main__.Test at 0x7fa91c307190>

>>> print t

<__main__.Test object at 0x7fa91c307190>

我测试的是t和print t，效果是一样的。

# 看到了么？上面打印类对象并不是很友好，显示的是对象的内存地址# 下面我们重构下该类的__repr__以及__str__，看看它们俩有啥区别

1）重构__repr__class TestRepr(Test):

def __repr__(self):

return 'TestRepr(%s)' % self.data

>>> tr = TestRepr()

>>> tr

TestRepr(hello, world!)

>>> print tr

TestRepr(hello, world!)

# 重构__repr__方法后，不管直接输出对象还是通过print打印的信息都按我们__repr__方法中定义的格式进行显示了

2）重构__str__

calss TestStr(Test):

def __str__(self):

return '[Value: %s]' % self.data

>>> ts = TestStr()

>>> ts

<__main__.TestStr at 0x7fa91c314e50>

>>> print ts

[Value: hello, world!]

# 你会发现，直接输出对象ts时并没有按我们__str__方法中定义的格式进行输出，而用print输出的信息却改变了

总结：

__repr__和__str__这两个方法都是用于显示的，__str__是面向用户的，而__repr__面向程序员。

打印操作会首先尝试__str__和str内置函数(print运行的内部等价形式)，它通常应该返回一个友好的显示。
__repr__用于所有其他的环境中：用于交互模式下提示回应以及repr函数，如果没有使用__str__，会使用print和str。它通常应该返回一个编码字符串，可以用来重新创建对象，或者给开发者详细的显示。

当我们想所有环境下都统一显示的话，可以重构__repr__方法；当我们想在不同环境下支持不同的显示，例如终端用户显示使用__str__，而程序员在开发期间则使用底层的__repr__来显示，实际上__str__只是覆盖了__repr__以得到更友好的用户显示

7. 装饰器

1. @property，这个东西可以直接把函数当做属性来用，例如

class test(object):

@property

def d(self):

return 4

t=test()

print t.d #使用了装饰器，这里可以直接写t.d，就可以输出值，而不是t.d()

2. @staticmethod装饰器，可以不把类test实例化，就能使用其中的方法，如下

class test(object):

@staticmethod #静态方法，把命名空间放在了类test中

def d(): #这里不需要加self参数了，类的普通内置方法的时候才会加self参数，这里和在类外面定义的函数是一样的

return 4

print test.d() #不用实例化，直接用class的名称来执行。

8. 继承

例子1

class Base(object):

def __init__(self,name)

self.name = name

class b(Base): #相当于在b中也有一个init函数

def get_name(self):

return self.name #如果写name就是错误的

new_class = b("lilei") #把b实例化

print new_class.get_name()

六. 模块

1.模块的基本概念

模块其实就是一个py文件，比如python内置模块linecache,可以用dir(linecache)查看模块内置方法

2.导入模块的方法

1）import #导入全部方法

import linecache

>>> dir(linecache)

['__all__', '__builtins__', '__doc__', '__file__', '__name__', '__package__', 'cache', 'checkcache', 'clearcache', 'getline', 'getlines', 'os', 'sys', 'updatecache']

>>> linecache.__file__ #linecache的脚本文件位置

'/usr/lib/python2.7/linecache.pyc'

2）from module import sth，只导入模块中的某个方法

from linecache import getlines，这样就可以直接使用getlines方法

>>getlines

3）from module import all 导入全部方法

from linecache import *，这种方式不会导入以下划线 (_) 开头的名称。

注意点，

1）在linecache的脚本文件中，有__all__ =["getline","clearcache","checkcache"]，这样用from linecache import *命令导入时，只会导入getline,clearcache,checkcache这三个方法，这三个方法相当于公有方法，所有人都可以使用；其他的方法相当于linecache的私有方法，比如updatecache,其他人不能任意用，使用import linecache时，就不会有这个限制。

2）当用这个方法导入多个模块的时候，不同模块中的方法名字可能会冲突，所以要慎用！

3.自定义模块

例如自定义个模块 m1

#coding=utf-8

def hash():

return 4

那么在其他脚本中就可以使用m1

#coding=utf-8

import m1

print m1.hash()

4.包的创建

包是一群模块的组合,所以先建一个文件夹，比如m2，作为包

1）写初始化文件 __init__.py #此时为空

为了让 Python 将目录当做包，目录下必须包含 __init__.py 文件；这样做是为了防止一个具有常见名字（例如 string）的目录无意中隐藏目录搜索路径中正确的模块。最简单的情况下，__init__.py 可以只是一个空的文件，但它也可以为包执行初始化代码或设置__all__

2）定义一个url.py

#coding=utf-8

def get_page():

return "some page content"

3）在其他脚本中引用包

注意使用from package import item时，item 可以是包的子模块（或子包），也可以是包中定义的一些其它的名称，比如函数、类或者变量。import语句首先测试 item 在包中是否有定义；如果没有，它假定它是一个模块，并尝试加载它。如果未能找到，则引发ImportError异常。

相反，使用类似 import item.subitem.subsubitem 这样的语法时，除了最后一项其它每项必须是一个包；最后一项可以是一个模块或一个包，但不能是在前一个项目中定义的类、函数或变量

#coding=utf-8

import m2

print dir(m2）#查看都什么内置模块

print m2.__file__ #会导入init文件

#print m2.url是不会调用url.py文件的，执行脚本的时候会出错，那么怎么调用呢？

方法1 -----在python命令行，以及在linux脚本中都能执行

import m2.url

print m2.url

#如果觉得m2.url比较麻烦，可以用import m2.url as url改名，as相当于一个赋值操作，代码如下

import m2.url as url

print url.get_page()

执行结果：

输出getpage（）定义的文本信息：some page content

方法2 ---这种方法可以在python命令行中执行，但是在linux的脚本中不能执行。

from m2 import url

print url.get_page()

如果只想使用url的get_page方法，怎么办呢？

方法1

from m2.url import get_page

print get_page()

方法2

from m2 import *

print url.get_page()

那么此时就需要在__init__.py中进行定义__all__ = ["url"]，但是经验证，不用在__inti__.py中定义也行。

5. 搜索模块

如果在上面的包中再写一个模块，比如test2.py, 这个在包里的模块怎么引入外部的模块呢? 比如外部模块为m1.py

import sys

sys.path.append("/tmp/m") #添加模块搜索路径，m文件夹中包含着m1.py文件，其实就是定位m1的位置。

import m1

print m1.bash() #调用m1的bash()方法，视频中多了代码 __all__ = ['hash'],测试下不会影响吗？经验证，不会影响。

6. 常用模块

1.我们去哪里找模块

pypi.python.org ---- 这个网站有大量的python的模块库

docs.python.org/2.7/ ---- python文档，其中Library Reference包含所有的内置模块的说明

2.我们应该首先选择哪些的模块

首先考虑的是内置模块，相关文档：http://docs.python.org/2.7/

3.常用模块

3.1 urllib，urllib2 --- 网络方面的模块

import urllib #urllib可能是一个包，包和模块的用法是一样的

dir(urllib)

help(urllib)里面FILE有脚本文件的位置信息

使用方法，比如获取网页内容

d = urllib.urlopen("http://www.baidu.com";)

print d.read()

3.2 datetime, time --- 时间模块

import time

time.time() #得到一个时间戳

import datetime

使用help(datetime)，看MODULE DOCS中的网站可以看到非常详细的例子

3.3 os --- 系统模块

import os

http://www.cnblogs.com/kaituorensheng/archive/2013/03/18/2965766.html

3.4 pickle --- 对象序列化

常用数据交换格式还有json， xml

import pickle

例子

class test(object):

def a(self):

return 4

def b(self):

return 5

d = test() #想把对象做持久化保存，比如放在文件里，那么需要把对象转变为字符串，就需要用到pickle

g=pickle.dumps(d) #对象转为字符串

type(g) #这里就转变成字符串了

g=pickle.loads(g) #反序列化，字符串转为对象

3.5 bsddb --- 一个轻量级的数据库，支持key=>value的字典形式

3.6 logging --- 日志

掌握 info, warning, error，重点看一下

七，异常

exception,中译异常，保守派的圣杯，被滥用的良药。

1. 出错的东西们，他们出了什么错，他们出错 = 被抛出了异常

2. 我们不想让他们出错，继续执行下面的程序，该怎么办？exception来了。

coding=utf-8

a = [1,2,3,4,5,6]

print a[5]

try:

print a[6]

except: #捕获异常

print u"哈哈哈哈，这里出错啦" #出错以后该做什么，这里输出出错信息

print '继续往下跑哦'

3. 基本语法

try:

" 框住了你感觉会抛出异常的代码 "

print "41223123"

print a[6] #这里抛出异常后就会跳到except语句，不会执行下面的print语句。

print "hahaha"

except:

" try代码块里的代码如果抛出异常了，该执行什么内容"

print u"哈哈"

else:

"try代码块里的代码如果没有抛出异常，就执行这里"

print "hoho"

finally:

"不管如何，finally里的代码，是总会执行的"

print "xixi"

4. 异常的应用

import urllib

#异常输出如下

sth_url = "http://wasdasdasd";

try:

d = urllib.urlopen(sth_url)

except:

print "哈哈哈出错了"

else:

content = d.read()

finally:

d.close(）

5.我们为什么不让他出错？

其实在开发阶段，我们是可以让任何东西出错的，这样能更快的排错来完善代码

6.什么时候用，怎么用？

我们什么时候用异常？答：不得不用的时候。

异常怎么用？

1. (我们知道会有哪些问题，分析问题，得到这些问题会抛出的指定异常)捕获不同的异常情况，最好不要只写except，这样捕获所有异常比较笼统。

比如上面的例子，可以通过写多个except语句，完善如下

sth_url = "http://wasdasdasd";

try:

d = urllib.urlopen(sth_url)

except IOError: #打不开网页的异常,这里的IOError是网页不对时python输出的异常信息。

print "网页出错了"

except 语法错误异常：

print "语法错误"

else:

content = d.read()

finally:

d.close()

2.异常的处理，要合理。要有日志。