第17课:函数高级应用

在上一个章节中,我们探索了 Python 中的高阶函数,相信大家对函数的定义和应用有了更深刻的认知。本章我们继续为大家讲解函数相关的知识,一个是 Python 中的特色语法装饰器,一个是函数的递归调用。

装饰器

Python 语言中,装饰器是“用一个函数装饰另外一个函数并为其提供额外的能力 ”的语法现象。装饰器本身是一个函数,它的参数是被装饰的函数,它的返回值是一个带有装饰功能的函数。通过前面的描述,相信大家已经听出来了,装饰器是一个高阶函数,它的参数和返回值都是函数。但是,装饰器的概念对编程语言的初学者来说,还是让人头疼的,下面我们先通过一个简单的例子来说明装饰器的作用。假设有名为downlaodupload的两个函数,分别用于文件的上传和下载,如下所示。

1import random
2import time
3
4
5def download(filename):
6    """下载文件"""
7    print(f'开始下载{filename}.')
8    time.sleep(random.random() * 6)
9    print(f'{filename}下载完成.')
10
11    
12def upload(filename):
13    """上传文件"""
14    print(f'开始上传{filename}.')
15    time.sleep(random.random() * 8)
16    print(f'{filename}上传完成.')
17
18    
19download('MySQL从删库到跑路.avi')
20upload('Python从入门到住院.pdf')

说明:上面的代码用休眠一段随机时间的方式模拟了下载和上传文件需要花费一定的时间,并没有真正的联网上传下载文件。用 Python 语言实现联网上传下载文件也非常简单,后面我们会讲到相关的知识。

现在有一个新的需求,我们希望知道调用downloadupload 函数上传下载文件到底用了多少时间,这应该如何实现呢?相信很多小伙伴已经想到了,我们可以在函数开始执行的时候记录一个时间,在函数调用结束后记录一个时间,两个时间相减就可以计算出下载或上传的时间,代码如下所示。

1start = time.time()
2download('MySQL从删库到跑路.avi')
3end = time.time()
4print(f'花费时间: {end - start:.2f}秒')
5start = time.time()
6upload('Python从入门到住院.pdf')
7end = time.time()
8print(f'花费时间: {end - start:.2f}秒')

通过上面的代码,我们可以在下载和上传文件时记录下耗费的时间,但不知道大家是否注意到,上面记录时间、计算和显示执行时间的代码都是重复代码。有编程经验的人都知道, 重复的代码是万恶之源,那么有没有办法在不写重复代码的前提下,用一种简单优雅的方式记录下函数的执行时间呢?在 Python 语言中,装饰器就是解决这类问题的最佳选择。通过装饰器语法,我们可以把跟原来的业务(上传和下载)没有关系计时功能的代码封装到一个函数中,如果uploaddownload 函数需要记录时间,我们直接把装饰器作用到这两个函数上即可。既然上面提到了,装饰器是一个高阶函数,它的参数和返回值都是函数,我们将记录时间的装饰器姑且命名为record_time ,那么它的整体结构应该如下面的代码所示。

1def record_time(func):
2    
3    def wrapper(*args, **kwargs):
4        
5        result = func(*args, **kwargs)
6        
7        return result
8    
9    return wrapper

相信大家注意到了,record_time函数的参数func代表了一个被装饰的函数,函数里面定义的wrapper 函数是带有装饰功能的函数,它会执行被装饰的函数func ,它还需要返回在最后产生函数执行的返回值。不知大家是否留意到,上面的代码我在第4行和第6行留下了两个空行,这意味着我们可以这些地方添加代码来实现额外的功能。record_time 函数最终会返回这个带有装饰功能的函数wrapper并通过它替代原函数func,当原函数funcrecord_time 函数装饰后,我们调用它时其实调用的是wrapper函数,所以才获得了额外的能力。wrapper 函数的参数比较特殊,由于我们要用wrapper替代原函数func,但是我们又不清楚原函数func 会接受哪些参数,所以我们就通过可变参数和关键字参数照单全收,然后在调用func的时候,原封不动的全部给它。这里还要强调一下,Python 语言支持函数的嵌套定义,就像上面,我们可以在record_time函数中定义wrapper函数,这个操作在很多编程语言中并不被支持。

看懂这个结构后,我们就可以把记录时间的功能写到这个装饰器中,代码如下所示。

1import time
2
3
4def record_time(func):
5
6    def wrapper(*args, **kwargs):
7        # 在执行被装饰的函数之前记录开始时间
8        start = time.time()
9        # 执行被装饰的函数并获取返回值
10        result = func(*args, **kwargs)
11        # 在执行被装饰的函数之后记录结束时间
12        end = time.time()
13        # 计算和显示被装饰函数的执行时间
14        print(f'{func.__name__}执行时间: {end - start:.2f}秒')
15        # 返回被装饰函数的返回值
16        return result
17    
18    return wrapper

写装饰器虽然颇费周折,但是这是个一劳永逸的骚操作,将来再有记录函数执行时间的需求时,我们只需要添加上面的装饰器即可。使用上面的装饰器函数有两种方式,第一种方式就是直接调用装饰器函数,传入被装饰的函数并获得返回值,我们可以用这个返回值直接替代原来的函数,那么在调用时就已经获得了装饰器提供的额外的能力(记录执行时间),大家试试下面的代码就明白了。

1download = record_time(download)
2upload = record_time(upload)
3download('MySQL从删库到跑路.avi')
4upload('Python从入门到住院.pdf')

在 Python 中,使用装饰器很有更为便捷的语法糖 (编程语言中添加的某种语法,这种语法对语言的功能没有影响,但是使用更加方法,代码的可读性也更强,我们将其称之为“语法糖”或“糖衣语法”),可以用@装饰器函数 将装饰器函数直接放在被装饰的函数上,效果跟上面的代码相同。我们把完整的代码为大家罗列出来,大家可以再看看我们是如何定义和使用装饰器的。

1import random
2import time
3
4
5def record_time(func):
6
7    def wrapper(*args, **kwargs):
8        start = time.time()
9        result = func(*args, **kwargs)
10        end = time.time()
11        print(f'{func.__name__}执行时间: {end - start:.2f}秒')
12        return result
13
14    return wrapper
15
16
17@record_time
18def download(filename):
19    print(f'开始下载{filename}.')
20    time.sleep(random.random() * 6)
21    print(f'{filename}下载完成.')
22
23
24@record_time
25def upload(filename):
26    print(f'开始上传{filename}.')
27    time.sleep(random.random() * 8)
28    print(f'{filename}上传完成.')
29
30
31download('MySQL从删库到跑路.avi')
32upload('Python从入门到住院.pdf')

上面的代码,我们通过装饰器语法糖为downloadupload函数添加了装饰器,被装饰后的downloadupload 函数其实就是我们在装饰器中返回的wrapper函数,调用它们其实就是在调用wrapper函数,所以才有了记录函数执行时间的功能。

如果在代码的某些地方,我们想去掉装饰器的作用执行原函数,那么在定义装饰器函数的时候,需要做一点点额外的工作。Python 标准库functools模块的wraps函数也是一个装饰器,我们将它放在wrapper 函数上,这个装饰器可以帮我们保留被装饰之前的函数,这样在需要取消装饰器时,可以通过被装饰函数的__wrapped__属性获得被装饰之前的函数。

1import random
2import time
3
4from functools import wraps
5
6
7def record_time(func):
8
9    @wraps(func)
10    def wrapper(*args, **kwargs):
11        start = time.time()
12        result = func(*args, **kwargs)
13        end = time.time()
14        print(f'{func.__name__}执行时间: {end - start:.2f}秒')
15        return result
16
17    return wrapper
18
19
20@record_time
21def download(filename):
22    print(f'开始下载{filename}.')
23    time.sleep(random.random() * 6)
24    print(f'{filename}下载完成.')
25
26
27@record_time
28def upload(filename):
29    print(f'开始上传{filename}.')
30    time.sleep(random.random() * 8)
31    print(f'{filename}上传完成.')
32
33
34# 调用装饰后的函数会记录执行时间
35download('MySQL从删库到跑路.avi')
36upload('Python从入门到住院.pdf')
37# 取消装饰器的作用不记录执行时间
38download.__wrapped__('MySQL必知必会.pdf')
39upload.__wrapped__('Python从新手到大师.pdf')

装饰器函数本身也可以参数化,简单的说就是装饰器也是可以通过调用者传入的参数来进行定制的,这个知识点我们在后面用到的时候再为大家讲解。

递归调用

Python 中允许函数嵌套定义,也允许函数之间相互调用,而且一个函数还可以直接或间接的调用自身。函数自己调用自己称为递归调用,那么递归调用有什么用处呢?现实中,有很多问题的定义本身就是一个递归定义,例如我们之前讲到的阶乘,非负整数N 的阶乘是N乘以N-1的阶乘,即$\small{N! = N \times (N-1)! }$,定义的左边和右边都出现了阶乘的概念,所以这是一个递归定义。既然如此,我们可以使用递归调用的方式来写一个求阶乘的函数,代码如下所示。

1def fac(num):
2    if num in (0, 1):
3        return 1
4    return num * fac(num - 1)

上面的代码中,fac函数中又调用了fac函数,这就是所谓的递归调用。代码第2行的if 条件叫做递归的收敛条件,简单的说就是什么时候要结束函数的递归调用,在计算阶乘时,如果计算到01 的阶乘,就停止递归调用,直接返回1;代码第4行的num * fac(num - 1) 是递归公式,也就是阶乘的递归定义。下面,我们简单的分析下,如果用fac(5)计算5的阶乘,整个过程会是怎样的。

1# 递归调用函数入栈
2# 5 * fac(4)
3# 5 * (4 * fac(3))
4# 5 * (4 * (3 * fac(2)))
5# 5 * (4 * (3 * (2 * fac(1))))
6# 停止递归函数出栈
7# 5 * (4 * (3 * (2 * 1)))
8# 5 * (4 * (3 * 2))
9# 5 * (4 * 6)
10# 5 * 24
11# 120
12print(fac(5))    # 120

注意,函数调用会通过内存中称为“栈”(stack)的数据结构来保存当前代码的执行现场,函数调用结束后会通过这个栈结构恢复之前的执行现场。栈是一种先进后出的数据结构,这也就意味着最早入栈的函数最后才会返回,而最后入栈的函数会最先返回。例如调用一个名为a 的函数,函数a的执行体中又调用了函数b,函数b的执行体中又调用了函数c,那么最先入栈的函数是a,最先出栈的函数是c 。每进入一个函数调用,栈就会增加一层栈帧(stack frame),栈帧就是我们刚才提到的保存当前代码执行现场的结构;每当函数调用结束后,栈就会减少一层栈帧。通常,内存中的栈空间很小,因此递归调用的次数如果太多,会导致栈溢出(stack overflow),所以递归调用一定要确保能够快速收敛。我们可以尝试执行fac(5000),看看是不是会提示RecursionError 错误,错误消息为:maximum recursion depth exceeded in comparison(超出最大递归深度),其实就是发生了栈溢出。

如果我们使用官方的 Python 解释器(CPython),默认将函数调用的栈结构最大深度设置为1000 层。如果超出这个深度,就会发生上面说的RecursionError。当然,我们可以使用sys模块的setrecursionlimit 函数来改变递归调用的最大深度,但是我们不建议这样做,因为让递归快速收敛才是我们应该做的事情,否则就应该考虑使用循环递推而不是递归。

再举一个之前讲过的生成斐波那契数列的例子,因为斐波那契数列前两个数都是1 ,从第三个数开始,每个数是前两个数相加的和,可以记为f(n) = f(n - 1) + f(n - 2) ,很显然这又是一个递归的定义,所以我们可以用下面的递归调用函数来计算第​n个斐波那契数。

1def fib1(n):
2    if n in (1, 2):
3        return 1
4    return fib1(n - 1) + fib1(n - 2)
5
6
7for i in range(1, 21):
8    print(fib1(i))

需要提醒大家,上面计算斐波那契数的代码虽然看起来非常简单明了,但执行性能是比较糟糕的。大家可以试一试,把上面代码for 循环中range函数的第二个参数修改为51 ,即输出前50个斐波那契数,看看需要多长时间,也欢迎大家在评论区留下你的代码执行时间。至于为什么这么慢,大家可以自己思考一下原因。很显然,直接使用循环递推的方式获得斐波那契数列是更好的选择,代码如下所示。

1def fib2(n):
2    a, b = 0, 1
3    for _ in range(n):
4        a, b = b, a + b
5    return a

除此以外,我们还可以使用 Python 标准库中functools模块的lru_cache函数来优化上面的递归代码。lru_cache 函数是一个装饰器函数,我们将其置于上面的函数fib1 之上,它可以缓存该函数的执行结果从而避免在递归调用的过程中产生大量的重复运算,这样代码的执行性能就有“飞一般”的提升。大家可以尝试输出前50个斐波那契数,看看加上装饰器以后代码需要执行多长时间,评论区见!

1from functools import lru_cache
2
3
4@lru_cache()
5def fib1(n):
6    if n in (1, 2):
7        return 1
8    return fib1(n - 1) + fib1(n - 2)
9
10
11for i in range(1, 51):
12    print(i, fib1(i))

提示lru_cache函数是一个带参数的装饰器,所以上面第4行代码使用装饰器语法糖时,lru_cache 后面要跟上圆括号。lru_cache函数有一个非常重要的参数叫maxsize,它可以用来定义缓存空间的大小,默认值是128。

总结

装饰器是 Python 语言中的特色语法,可以通过装饰器来增强现有的函数,这是一种非常有用的编程技巧。另一方面,通过函数递归调用,可以在代码层面将一些复杂的问题简单化,但是 递归调用一定要注意收敛条件和递归公式,找到递归公式才有机会使用递归调用,而收敛条件则确保了递归调用能停下来。函数调用通过内存中的栈空间来保存现场和恢复现场,栈空间通常都很小,所以 递归如果不能迅速收敛,很可能会引发栈溢出错误,从而导致程序的崩溃