递归调用在循环体内: 把循环展开, 这种情况是先循环再递归

整理自陈莉君（翻译深入理解Linux内核的作者）老师文章。

阿里2015笔试中有这样一道题目：

在一台主流配置的PC上，调用f(35)所需要的时间大概是（）。

int f(int x){

int s = 0;

while(x++ >0) s+= f(x);

return max(s,1);

}

A．几毫秒 B．几秒 C．几分钟 D．几小时

本题涉及到的知识点包括数据的表示和运算、时间复杂度。考查考生对带符号整数的表示、递归调用的执行过程、计算机系统性能、虚拟存储器、C语言语句等相关知识的理解和运用能力。

数学上的分析推导结果与计算机系统中的执行结果是有差异的。例如，在数学中一个数可以无限大，但在计算机中受表示位数的限制，数的值是有限的。用数学分析的方法，本题的递归是可以终止的，但受存储容量的限制，在计算机中递归调用时会有栈溢出的问题，导致程序不能正常执行结束。类似的问题还有很多，这是平时编程时需要注意的。

假设题目中的函数用C语言书写，要分析调用f(35)所需的时间，就得分析代码执行中循环执行次数和递归调用次数等，下面深入剖析f(35)执行过程中存在的问题。

注意：以下231为2的31次方。

（1）程序是否会终止？

调用f(35)时，入口参数x=35。从数学的角度理解while中的判断表达式“x++ >0”，会认为x在增量后永远大于0，这是一个永真式，从而做出错误结论：程序死循环。在计算机中数值是有范围的，int型数据用补码表示，占4个字节，能表示的最大正数是231-1 = 7FFF FFFFH。231的机器数是8000 0000H，其值为int型，能表示的最小负数-2147483648，因此当x = 8000 0000H 时，x > 0的值为假，程序退出while循环，因此，若不考虑栈溢出，则程序能执行结束。

（2）使递归终止的最大x值是多少？

while(x++ >0)语句在Microsoft VC中的机器代码如下，该语句的执行过程是：先把x的值分别保存到EDX和EAX寄存器；然后对EAX寄存器内容加1，以实现x = x+1操作；最后再用EDX的内容（x的旧值）进行x>0的条件判断。

mov edx, dword ptr [ebp+8]

mov eax,dword ptr [ebp+8]

add eax, 1

mov dword ptr [ebp+8], eax

test edx, edx

jle f+77h (00401097)

因此，当调用f(231-1)时，x = 231-1=7FFF FFFFH，先执行x=7FFF FFFFH+1 = 8000 0000H=231，然后，用旧的x=7FFF FFFFH与0比较，比较结果为真，故执行while循环体，在循环体中调用f(231)。

调用f(231)时，x为231 = 8000 0000H，其真值为负数，因此，与0比较的结果为假，故跳出while循环体，程序结束。

综上所述，使递归终止的最大x值是231，即执行f(231)时结束递归调用。

（3）函数f(x)的递归调用情况如何？

f(x)是一个递归调用过程，并且递归调用在循环体内，因此调用关系较复杂。图1显示了f(231-4)执行中的递归调用情况。

图1 f(231-4)执行中的递归调用情况

在f(x)执行过程中，把执行f(x)过程体的总次数记为f(x)执行次数，把一次递归调用的最大次数记为f(x)递归深度。表1给出了x为不同值时，执行f(x)的次数和递归深度。这两个参数显示了f(x)函数的执行过程。

表1 x为不同值时，f(x)执行的次数和递归调用深度

	f(x)执行次数	递归深度
f(231)	1	1
f(231-1)	2	2
f(231-2)	4	3
f(231-3)	8	4
f(231-4)	16	5
……	……	……
f(231-n)	2n	n+1
f(35)=f(231-2147483613)	22147483613	2147483614

（4）递归调用过程的执行情况

系统会给每一个用户进程分配存放代码和数据的用户空间，用户空间中的栈区用来存放程序运行时过程调用的参数、返回地址、过程局部变量等。随着程序的执行，栈区不断动态地从高地址向低地址增长或向反方向减退。

用户栈由若干个栈帧组成，每个过程对应一个栈帧，帧指针寄存器EBP指定一个栈帧的起始地址，栈指针寄存器ESP指向栈顶，当前栈帧的范围在EBP和ESP指向的区域之间。过程执行时，由于不断有数据入栈，所以栈指针ESP会动态移动，而帧指针EBP固定不变。在一个过程内对栈中信息的访问大多通过帧指针EBP进行。

IA-32规定，寄存器EAX、ECX和EDX是调用者保存寄存器，EBX、ESI、EDI寄存器是被调用者保存寄存器。若过程P调用过程Q时，P在需要时先在自己的栈区保存EAX、ECX和EDX、入口参数和返回地址，接着跳转到Q执行。Q在自己的栈帧中先保存P的EBP值，并设置EBP指向当前Q栈帧的栈低，根据需要保存EBX、ESI、EDI，再在栈中给Q的局部变量分配空间。

在递归调用执行中，每个递归调用过程都有一个栈帧。栈帧中可能包含如图2所示的信息。

……

调用者的EBP值

调用者的EBX、ESI、EDI

过程局部变量

自己的EAX、ECX和EDX

入口参数n

……

入口参数1

返回地址

图2 一次递归调用中的栈帧

图3显示了在windows系统中f(x)函数调用时的部分机器指令。可以看出f(x)的栈帧至少有84B。系统分配给一个进程的用户栈只有有限的空间，因此，递归调用的次数是有限的。f(35)的递归深度是2147483614，即至少需要2147483614×84字节，即大于170GB的栈帧空间。在32位系统中，最大虚拟地址空间仅有4GB，用户栈只是其中的一部分，所以f(35)在执行过程中会出现栈溢出的现象。

图3 f(x)函数调用时的部分机器指令

（5） f(35)在32位系统中的实际执行情况

假设在Intel x86+windows+VC+C语言环境中执行f(35)。VC中默认分配栈的大小是1MB，虽然用户可以调整栈大小，但栈的容量是有限的。按2MB的栈空间、栈大小按80字节计算：2MB÷80B≈26214，因此f(x)递归调用的次数不会超过26214-1=26213次。从图4.9中可以看出，栈溢出时，f(x)函数体最多执行26213次。栈溢出时每个f(x)函数体只在while语句中执行，假设每个f(x)函数体执行100条指令，即使指令平均CPI为3，时钟频率为2.4GHz，f(35)的执行时间也只有26213×100×3÷2.4GHz ≈3.2 ms左右时间。

对f(35)的执行做了测试，在栈大小是1MB时，递归调用11244次后栈溢出；在栈设置为2MB时，递归调用22642次后栈溢出，显然运行时间只有几毫秒。在Microsoft VisualStudio 2012环境中运行，出现如图4所示结果，表明出现了栈溢出（Stack overflow）。

综上所述，答案为A。

以上整理自陈莉君老师的文章。对于其中不容易理解的图1 f(231-4)执行中的递归调用情况这里给出注释：

对于递归在循环体内我们可以把循环展开，这种情况是先循环再递归：

while(x++ >0) s+= f(x);

等价写法(当x=0x80000000-2)：

if(0x80000000 -2 >0) { // if(x >0)

0x80000000-1; //x++

s+=f(0x80000000-1); //f(x)

}

if(0x80000000-1 > 0) {

0x80000000;

s+=f(0x80000000);

}