算法的复杂度学习笔记

同一个问题可以用不同的算法实现，而算法是有优劣之分的。我们经常需要对算法进行分析，以便于选择合适的算法和改进算法。

通常我们从两个维度来描述算法的优劣：程序代码的执行时间和代码占用的内存空间。两者分别叫做算法的时间复杂度和算法的空间复杂度，合称算法的复杂度。

时间复杂度和空间复杂度可以反映出算法的效率。

时间复杂度

时间复杂度用来衡量算法的执行时间，用 O 表示。

事实上，代码执行时所耗费的时间，只有在机器上运行后才能知道，从理论上是不能算出来的。为了方便，我们用执行到的语句数量来表示执行的时间。语句执行次数越多，代码所耗费的时间越长。

举些栗子。

function isEven(num) {
    let isEven = num % 2 === 0
    return isEven
}

这是一个判断一个数是否为偶数的函数，运行时执行到了两条语句，它的时间复杂度为 O(2)。

function sum(arr) {
    let total = 0
    for (let i = 0; i < arr.length; i++) {
        total += arr[i]
    }
    return total
}

这是一个求和的函数，它的时间复杂度取决于参数数组的大小。算法的执行时间往往取决于要处理的数据的大小，通常我们把要处理的数据的大小叫做问题的规模，用 n 表示。在这个示例中，n 就是数组的长度。

所以，这个求和算法的复杂度为 O(3n + 3)。

说实话，计算这个复杂度还挺麻烦的。很多时候，我们不需要计算得那么精确，我们只需要知道算法的大致时间就好了。对于计算机来说，多执行几条命令在时间上效率并没有提高多少。

为了方便计算和比较不同的时间复杂度，我们需要对结果去掉低阶项，去掉常数项，去掉高阶项的常参。这话涉及到多项式的知识，可能比较难理解，可以看下面示例。

O(3) = O(99999) = O(1)
O(2n + 4) = O(n + 999) = O(n)
O(2n^2) = O(3n^2 + 8) = O(8n^2 + 4n + 7) = O(n^2)
O(n^3 + 2n^2) = O(n^3)

这样的话，计算时间复杂度就方便很多了。

如果一个算法的时间复杂度是个常数，即随着问题的规模（n）的增大，它的时间复杂度不变，那么算法的时间复杂度为 O(1)。

let sum = 0
for (let i = 1; i <= 100; i++) {
    sum += sum
}

比如这个求 1 + 2 + 3 + ... + 100 的算法，它的时间复杂度是 O(1)。因为它的时间复杂度是个常数，大概 300 多，我们不需要知道具体的值是多少。

function sort(arr) {
    for (let out = 0; out < arr.length - 1; out++) {
        for (let j = 0; j < arr.length - out - 1; j++) {
            if (arr[j] > arr[j + 1]) {
                let tmp = arr[j]
                arr[j] = arr[j + 1]
                arr[j + 1] = tmp
            }
        }
    }
    return arr
}

这是冒泡排序法，用到了二重循环，每重循环的次数大概为 n（arr.length），因此它的时间复杂度为 O(n^2)。

一个简单的判断时间复杂度的方法就是，如果算法中只用到了一重循环，并且循环的次数大致为 n，那么算法的时间复杂度为 O(n)；如果算法中用到了二重循环，每重循环的次数大概为 n，因此它的时间复杂度为 O(n^2)；以此类推。

我们再来看一个函数。

function find(arr, num) {
    for (let i = 0; i < arr.length; i++) {
        if (arr[i] === num) {
            return true
        }
    }
    return false
}

这是一个判断数组中是否存在一个目标数的函数。它的执行时间更是不确定的。如果要查找的数在数组的第一个，那么它只需要执行几条语句能完成了。如果目标数是数组的最后一个，或者在数组中不存在，那么要执行的时间就很久了。通常我们在讨论算法的时间复杂度时，指的是在最坏的情况下，算法的时间复杂度。因此，这个算法的时间复杂度是 O(n)。

我们再来看一个例子：

for (let i = 1; i <= n; i *= 2) {
    console.log(i)
}

在这个示例中，i 是指数增长的，我们假设执行的次数为 m，那么 2^m = n，即 m = logx2(n)。因此，时间复杂度为 log2(n)。

常见的时间复杂度

常见的时间复杂度有下面这些（按数量级递增排列）：

常数阶O(1) -> 对数阶O(log2n) -> 线性阶O(n) -> 线性对数阶O(nlog2n) -> 平方阶O(n^2) -> 立方阶O(n^3) -> k次方阶O(n^k) -> 指数阶O(2^n)。

空间复杂度

空间复杂度用来表示算法的执行时所需存储空间的度量。

计算的方法和时间复杂度类似，这里不再赘述。

比如上面的冒泡排序法，空间复杂度为 O(1)。

应用

前面说过，我们经常对算法进行分析，以便于选择合适的算法和改进算法。

在改进算法方面，如果程序注重运行时间，有时我们会选择牺牲空间复杂度的方式来换取算法的时间复杂度。

比如 LeetCode 的第一道算法题（有兴趣自行百度 LeetCode Two Sum），一般情况下我们采用双重循环来做，时间复杂度为 O(n)，这样的话代码的执行时间就会超出限制的时间。所以只好采用一重循环 + Map 的思路来做。这是一个典型的“以空间换时间的”的例子。

熟悉算法复杂度的概念，也可以帮助我们选择适合的算法。

比如我们知道了冒泡排序法的平均时间复杂度为 O(n^2)，空间复杂度为 O(1)，快速排序法是的平均时间复杂度为 O(log2(n))，空间复杂度为 O(1)。那么很显然，当数据量比较大的时候，快速排序法明显会比冒泡排序法更加高效。

当然，算法复杂度并不是衡量算法时唯一考虑的因素。很多时候，我们还需要考虑算法是否容易实现、代码可读性等等。

就以上面的排序算法来说。快速排序算法不是稳定的，而冒泡排序是稳定的算法，稳定性也是选择排序算法考虑的因素之一。