Python 部分内置函数、作用域、闭包、递归

一、内置函数如何使用

help()一下:

如想看min()咋用?在shell中:help(min)

二、部分内置函数

(一).排序:sorted()

li = [(1, 2, 3, 4), (7, 8, 1, 4), (3, 4, 6, 2), (6, 5, 9, 2)]
print(sorted(li, key=lambda a: a[1]))
# lambda a: a[1] 以元组的第二个值作为排序依据。
# 运行结果:[(1, 2, 3, 4), (3, 4, 6, 2), (6, 5, 9, 2), (7, 8, 1, 4)]
View Code

sorted()是python3的内置函数,返回一个新列表,不改变原来的数据,如要改变需赋值。

sort()是列表的函数:list.sort(),没有返回值,直接在原数据上进行修改。

例1:以第二级路径为准,进行从小到大排序

l3 = ['/boot/grub', '/usr/local', '/home/dongwm']
print(sorted(l3, key=lambda x: x.split("/")[2]))

"""
['/home/dongwm', '/boot/grub', '/usr/local']

for each in l3:
    print(each.split("/"))
结果:(因为第一个斜杠前没有任何内容,所以切出来是空字符)
['', 'boot', 'grub']
['', 'usr', 'local']
['', 'home', 'dongwm']
"""
View Code

(二).枚举:enumerate()

enumerate是个迭代器。如要查看枚举中的内容,可用list(),tuple()来查看。

print(list(enumerate([1, 2, 3])))
# 运行结果:[(0, 1), (1, 2), (2, 3)]

# 可指定索引的开始值:
print(list(enumerate([1, 2, 3], 2)))
# 运行结果:[(2, 1), (3, 2), (4, 3)]

# 转换为一个字典:(这里同样指定了索引的开始值)
print(dict(enumerate([1, 2, 3], 2)))
# 运行结果:{2: 1, 3: 2, 4: 3}
View Code

(三).过滤器:filter(function or None,iterable)

筛选出自己想要的内容。对每个元素进行判断,返回True或False,返回False会被自动过滤掉,返回由符合条件元素组成的新迭代器对象。

第一个参数需要放一个函数体,或者写"None",因为是必备参数。

# 提取一个列表中,出大于2的元素
print(list(filter(lambda x: x > 2, [1, 2, 3, 4, 5])))
# 运行结果:[3, 4, 5]

如上运行结果:把符合条件的都提取出来了

(四).zip(iterable1,iterable2,...)

是一个匹对的内建函数,将可迭代对象中的元素,一对一地进行匹对起来。以最短的那个iterable为参照

# 对每个iterable中的元素进行逐一匹对
print(list(zip([1, 2, 3], ["a", "b", "c"], [10, 20, 30])))
# 运行结果:[(1, 'a', 10), (2, 'b', 20), (3, 'c', 30)]
# 既然是一一对应,那么少了其中任何一个都不会再去匹对了

# 少了第二个iterable中的 "b"
print(list(zip([1, 2, 3], ["a", "c"], [10, 20, 30])))
# 运行结果:[(1, 'a', 10), (2, 'c', 20)]

# 少了第一个iterable中的2和第三个iterable中的10
print(list(zip([1, 3], ["a", "b", "c"], [20, 30])))
# 运行结果:[(1, 'a', 20), (3, 'b', 30)]
View Code
# 同时遍历两个或更多的序列,可以使用 zip() 组合
questions = ["what's your name", "how old", "favorite color"]
answers = ["quanquan616", 30, "blue"]
for i, j in zip(questions, answers):
    print("{}? {}".format(i, j))

"""
运行结果:
what's your name? quanquan616
how old? 30
favorite color? blue
"""
View Code
# 将两支队伍随机打乱,然后进行两两匹对
p1 = ["猛龙", "老鹰", "公牛", "凯尔特人", "湖人"]
p2 = ["魔术", "奇才", "雄鹿", "雷霆", "鹈鹕"]

from random import shuffle

shuffle(p1)
shuffle(p2)

for i, j in zip(p1, p2):
    print(f"{i} VS {j}")

"""
湖人 VS 雷霆
猛龙 VS 奇才
公牛 VS 雄鹿
凯尔特人 VS 魔术
老鹰 VS 鹈鹕
"""
View Code

(五).加工:map(func,iterable)

func是指定一个函数体,指定以什么方式去加工。把函数依次作用在序列的每个元素上,得到一个新的迭代器对象。

print(list(map(str, [1, 2, 3])))
# 远行结果:['1', '2', '3']

此例中,str是指定了加工的方式。

list()是用来查看map()对象中的元素,tuple()也可以。

(六).反复调用函数:reduce(func,iterable)

reduce()指定的函数必须接收两个参数,reduce对可迭代对象的每个元素反复调用函数,并返回最终结果值。

例1:

from functools import reduce


def add(a, b):
    return a + b


print(reduce(add, [1, 2, 3]))  # 6
View Code

例1中,先把1和2传给函数add,执行并返回了3。接着刚才的结果3当做a,列表中的第三个元素3当做参数b,再去传值并调用add函数,最后返回总结果6。

例2:

from functools import reduce


def add(x, b):
    return x + b


print(reduce(add, [1, 2, 3], 10))  # 16
View Code

例2说明了reduce还可以接受第三个参数,作为计算的初始值10。

三、作用域(全局、局部变量)

全局变量定义在函数体外,可以访问,但不可以修改。

(一).global用途

(1)、如果要修改函数体外定义的全局变量,需要在对应变量名前加"global"关键字来修饰。(类似授权的概念)

(2)、函数体中的局部变量,如果要在函数体外访问到它,也需要在前加"global"

# --- global 第一种用法 --- #
n = 1 # 这里是全局变量
def fun():
    n += 1
    print(n)
fun()
# 运行直接报错!
# UnboundLocalError: local variable 'n' referenced before assignment
# 大意:n 是局部变量,未定义,无法使用
# 需要在 n 前加上 global

n = 1
def fun():
    global n
    # 不能写成:global n += 1 会报语法错误!
    n += 1
    print(n)
fun()

# 还有一种情况:
n = 1  # 这里是全局变量
def fun(a, b):
    n = a + b  # n 在这里是局部变量
    print(n)
fun(10, 20)
print(n)

# 运行结果:30 1
View Code
# --- global 第二种用法 --- #
def fun():
    n = 616
fun()
print(n) # NameError: name 'n' is not defined // 语法错误 n 没有定义
# 在外要想访问函数体里的局部变量 n 就需要在前面加 global

def fun():
    # 如果 n 在 global 语句前定义,就会报错!
    # SyntaxError: name 'n' is assigned to before global declaration
    # 语法错误:n 在global声明前就分配了
    global n
    n = 616
fun()
print(n)
View Code

(二).nonlocal

当里层局部,需要修改局部外层时,用nonlocal修饰。在嵌套函数中会用到。

def outer():
    num = 10
    def inner():
        nonlocal num  # nonlocal关键字声明
        # 不声明依旧是这个报错:UnboundLocalError: local variable 'num' referenced before assignment
        num = 100
        print(num)
    inner()  # 不调用是不会执行的 // 必须写在这里,不然未定义报错,因为函数必须先声明后使用  
    print(num)
outer()

# 运行结果:100 100
View Code

(三).总结

(1).外部不能访问函数内部的变量。

(2).函数内部能够访问函数外部的变量。

(3).函数里部不能修改函数外部的变量。

(四).作用域链

从内向外,依次去寻找变量。

在函数定义的时候,作用域链其实就已经形成了。

(五).练习

(1).练习1,选哪个?

选d,变量的作用域概念。模块中x是全局变量,函数中的x是局部变量,变量的查找顺序是LEGB(L的级别最高)

(2).练习2,为什么报错?

函数内部的变量名第一次出现,而且出现在等号前面,即被视为定义一个局部变量,不管全局域中有没有用到该变量名,函数中使用的将是局部变量

把g=2放到函数内的第一行,那么g就是一个局部变量,整个函数内就会使用这个局部变量,变量在使用前被声明,就不会报错了。

其实,归根到底就是因为作用域的级别问题。L的级别最高,当有了L的时候,就会优先使用L。g的声明在第9行之后,在声明前就使用,必然会引起报错。

四、Python变量作用域的四个级别

BGEL,作用域的级别依次升高,级别最高的是Local,如果该变量在Local中已经声明并赋值,将优先使用Local中的变量对应的值。

(一).B:build-in 系统固定模块里面的变量,也叫系统变量,比如int,这些变量可以通过builtins模块获取。

builtins模块里面的这些函数和类等内容构成了内置作用域。这些函数和类可以直接使用,Python会从这里找到他们。

(二).G:global 全局变量,在单个程序文件里面都可用,它位于文件代码的顶级。

(三).E:enclosing 嵌套的父级函数的局部作用域,就是包含此函数的上层函数的局部作用域。

E和L是相对的,E中的变量相对上层来说也是L。E嵌套作用域,在local中取值,但是local中没有,就会去E里面找。

例1:

g = 0


def run():
    g = 2

    def run2():
        print(g)

    return run2


f = run()
f()
# 打印结果:2
View Code

run函数内嵌套了函数run2,run2内使用变量g,但是run2里面没有,所以它从内向外找,就找到了run的作用域。

注意run函数的最后一句,它返回了run2这个函数,f=run(),就是把run2函数赋值给f,f()就是执行了run2函数,但是可以访问run函数的作用域。

(四).L:local 局部作用域,即为函数中定义的变量。

(五).案例

(1).例1

阅读代码,写出运行结果

g = 0


def run():
    def run2():
        g = 1
        print(g)

    print(g)

    return run2


f = run()
f()
View Code

结果为:0 1(先打印出0,再打印出1)

分析:

首先,return语句与第一层函数中的print(g)属于同层语句,return在print之后,所以先执行第一层函数中的print(g)这条语句。

根据作用域级别来对待,第一层函数的print语句并不在嵌套函数run2中,所以不存在L和E级别的说法,但是变量g出现在了G级别中,所以会去使用全局变量,此时全局变量g=0,所以0是第一个被打印出来。

接下来,内嵌函数run2中有了L级别的变量g,此时会根据作用域级别的约定,优先使用L级别中的变量。而f()相当于执行了run2函数,理所当然会打印出1。

五、回调函数

def test1():
    print("111")

def fun2(a):
    a()
    print("222")

# 后面调用前面
fun2(test1)  # 把函数体当作参数传过去

   

六、闭包

首先,闭包需要是嵌套函数。调用外层,返回里层的函数体(外层函数返回里层函数) 

通俗地讲:闭包是函数里面嵌套函数,外层函数返回里层函数,这种情况称之为闭包。闭包能够维持住这个变量。

简单来说,闭包有这么3个作用:

(1).构造局部的全局变量。

(2).在没有类的情况下,封装变量。

(3).实现装饰器的基础

(一).一个简单的闭包实例

def fun1():
    a = 1
    print(a)

    def fun2():  # 封闭在函数里面
        b = 2
        print(b)

    return fun2  # 加了括号()是调用。不加括号"()",返回函数体

print(fun1())

"""
运行结果:
1
<function fun1.<locals>.fun2 at 0x0067D6F0>
"""

(二).Python闭包的延迟绑定

(1).问题引入

以下这段代码运行后,将会打印出什么结果?

def multipliers():
    return [lambda x: i * x for i in range(4)]


print([m(2) for m in multipliers()])
# [6, 6, 6, 6]
View Code

结果是四个6,为什么不是正常理解中的[0,2,4,6]?

(2).原因分析

原因是Python闭包的延迟绑定。内部函数被调用时,参数的值在闭包内进行查找。

当任何由multipliers()返回的函数被调用时,i的值将在附近的范围进行查找,是在内部函数被调用时查询得到的。那时,不管返回的函数是否被调用,for循环已经完成,i被赋予了最终的值3。

因此,每次返回的函数乘以传递过来的值3,因为上段代码传过来的值是2,它们最终返回的都是6(3*2)。

lambda表达式创造的函和def创造的函数是一样的。

将上段代码拆开来写,等价于:

def multipliers():
    l1 = []

    for i in range(4):
        def _inner(x):
            return i * x

        l1.append(_inner)

    return l1
View Code

这个问题说白了,就是Python的设定而已,Python就是这么设定的。那么在使用中,就需要避开这个坑。

以下的三个解决方案均可有效避开这个问题:

(3).解决方案1

利用生成器(个人认为是最简单最好理解的方式)

def multipliers():
    for i in range(4):
        def inner(x):
            return i * x

        yield inner
View Code

当一个函数中出现了yield关键词,那么这个函数就变成了一个生成器,生成器的特性:暂停、返回信息、记住当前函数运行的所有信息。

当第一次yield,返回函数体的时候,i是0,0*2=0,所以第一个结果是0,此时函数是处于暂停状态,而且生成器记住了当前函数运行的所有信息。

当再次去操作生成器的时候,生成器会从上次的暂停处继续运行下去。由于生成器记住了函数运行的所有信息,那么它肯定会去取出range对象中的第二个元素,也就是i=1,1*2=2,

以此类推,最后的结果就是:[0, 2, 4, 6]

可以简写成:

def create_multipliers():
    for i in range(4):
        yield lambda x: x * i
View Code

也可以是以圆括号表现的推导式:

def create_multipliers():
    return (lambda x: x * i for i in range(4))
View Code

(4).解决方案2

利用默认函数立即绑定

def multipliers():
    return [lambda x, i=i: i * x for i in range(4)]
View Code

拆开来写,等价于:

def multipliers():
    l1 = []

    for i in range(4):
        def inner(x, i=i):
            return x * i

        l1.append(inner)

    return l1
View Code

对比问题引入那段代码来看,其实就相当于给定了里层函数一个默认值,立即赋值,不让闭包再去外层找变量。

(5).解决方案3

偏函数

from functools import partial
from operator import mul


def multipliers():
    return [partial(mul, i) for i in range(4)]


print([m(2) for m in multipliers()])
View Code

(6).补充

闭包+回调函数+语法糖=装饰器

七、递归

递归的特点:

(1).自己调用自己。

(2).必须要有一个出口!

# 示例:5的阶乘
# 5! = 5*4*3*2*1
def jiec(n):
    if n == 1:
        return 1
        # 如果把1写成0,结果就是0了。因为最后一个数乘以了0
    else:
        return jiec(n - 1) * n
print(jiec(5))

八、补充内容

可变的数据类型,可以在函数里面,直接进行修改:

li = [1, 2, 3]
tu = ("a", "b", "c")

def test(li, tu):
    # 元组不可变,所以tu不能直接修改
    # 而li就可以在函数中直接修改
    li.append("python")

test(li, tu)

print(li)  # 原来的li被修改了
print(tu)

"""
远行结果:
[1, 2, 3, 'python']
('a', 'b', 'c')
"""
View Code

好处:在函数中修改了,无需重新赋值,就会改变。

坏处:当不想改变原数据时,显得略坑,需要提前copy()一份。

可变的对象都有copy()这个方法。

小练习: 

(1).定义一个函数,输入一个序列(序列元素是同种类型),判断序列是顺序还是逆序,顺序输出"UP",逆序输出"DOWN",乱序否则输出"None"

import re

def is_up_down_none(list_value): up = sorted(list_value) # 顺序排序 down = sorted(list_value, reverse=True) # 倒序排序 if list_value == up: # 原列表与up比较 print("顺序的,UP") # 一样的话肯定是顺序的 elif list_value == down: # 原列表与down比较 print("倒序的,DOWN") # 一样的话肯定是倒序的 else: print("乱序的,None")
while 1: strings = input("请输入内容:") list_value = list(re.findall("[a-zA-Z0-9]", strings)) # 用正则提取出每个元素,因为比较的是列表 is_up_down_none(list_value)

(2).写一个函数,对列表li = [9,8,3,2,6,4,5,7,1],进行从小到大的排序。最后返回li

# 使用内置函数:sorted()
def sorting(li1):
    return sorted(li1)
li1 = [9, 8, 3, 2, 6, 4, 5, 7, 1]
g = sorting(li1)
print(g)

使用冒泡排序法:

def bubbling(li1):
    for i in range(len(li1)): # list的下标是从0开始的,range()左闭右开,取不到最后一个数值,刚好不会造成列表index溢出
        for j in range(i): # 只需比较8次就可以了,因为最后一次肯定是最小值在前面了
            if li1[i] < li1[j]:
                li1[i], li1[j] = li1[j], li1[i]
    print(li1)
li1 = [9, 8, 3, 2, 6, 4, 5, 7, 1]
bubbling(li1)
"""
每个数字都与其他的做比较,然后进行交换。
外面一层循环即是控制比较几次,也是确定当前的下标,
里面一层循环控制每个数字都与外面的那个下表进行对比。
"""
View Code
原文地址:https://www.cnblogs.com/quanquan616/p/8319196.html