浅析深度优先和广度优先遍历实现过程、区别及使用场景

一、什么是深度/广度优先遍历？

　　深度优先遍历简称DFS（Depth First Search），广度优先遍历简称BFS（Breadth First Search），它们是遍历图当中所有顶点的两种方式。

　　这两种遍历方式有什么不同呢？我们来举个栗子：

　　我们来到一个游乐场，游乐场里有11个景点。我们从景点0开始，要玩遍游乐场的所有景点，可以有什么样的游玩次序呢？

1、深度优先遍历

　　第一种是一头扎到底的玩法。我们选择一条支路，尽可能不断地深入，如果遇到死路就往回退，回退过程中如果遇到没探索过的支路，就进入该支路继续深入。在图中，我们首先选择景点1的这条路，继续深入到景点7、景点8，终于发现走不动了：

　　于是，我们退回到景点7，然后探索景点10，又走到了死胡同。于是，退回到景点1，探索景点9：

　　按照这个思路，我们再退回到景点0，后续依次探索景点2、3、5、4、发现相邻的都玩过了，再回退到3，再接着玩6，终于玩遍了整个游乐场：

　　具体次序如下图，景点旁边的数字代表探索次序。当然还可以有别的排法。

　　像这样先深入探索，走到头再回退寻找其他出路的遍历方式，就叫做深度优先遍历（DFS）。

　　这方式看起来很像二叉树的前序遍历。没错，其实二叉树的前序、中序、后序遍历，本质上也可以认为是深度优先遍历。

2、广度优先遍历

　　除了像深度优先遍历这样一头扎到底的玩法以外，我们还有另一种玩法：首先把起点相邻的几个景点玩遍，然后去玩距离起点稍远一些（隔一层）的景点，然后再去玩距离起点更远一些（隔两层）的景点…

　　在图中，我们首先探索景点0的相邻景点1、2、3、4：

　　接着，我们探索与景点0相隔一层的景点7、9、5、6：

　　最后，我们探索与景点0相隔两层的景点8、10：

　　像这样一层一层由内而外的遍历方式，就叫做广度优先遍历（BFS）。

　　这方式看起来很像二叉树的层序遍历。没错，其实二叉树的层序遍历，本质上也可以认为是广度优先遍历。

二、深度/广度优先遍历的实现

　　那么我们如何来实现图的深度优先和广度优先遍历的算法呢？

　　实现深度优先遍历的关键在于【回溯】；实现广度优先遍历的关键在于【重放】。下面我们来演示一下两种算法的实现过程。

1、深度优先遍历实现

　　首先说说深度优先遍历的实现过程。这里所说的回溯是什么意思呢？回溯顾名思义，就是自后向前，追溯曾经走过的路径。

　　我们把刚才游乐场的例子抽象成数据结构的图，假如我们依次访问了顶点0、1、7、8，发现无路可走了，这时候我们要从顶点8退回到顶点7。

　　而后我们探索了顶点10，又无路可走了，这时候我们要从顶点10退回到顶点7，再退回到顶点1。

　　像这样的自后向前追溯曾经访问过的路径，就叫做回溯。

　　要想实现回溯，可以利用栈的先入后出特性，也可以采用递归的方式（因为递归本身就是基于方法调用栈来实现）。

　　下面我们来演示一下具体实现过程。

　　首先访问顶点0、1、7、8，这四个顶点依次入栈，此时顶点8是栈顶：

　　从顶点8退回到顶点7，顶点8出栈 —— 存储路径的栈：0-1-7

　　接下来访问顶点10，顶点10入栈 —— 存储路径的栈：0-1-7-10

　　从顶点10退到顶点7，从顶点7退到顶点1，顶点10和顶点7出栈 —— 存储路径的栈：0-1

　　探索顶点9，顶点9入栈 —— 存储路径的栈：0-1-9

　　以此类推，利用这样一个临时栈来实现回溯，最终遍历完所有顶点。

2、广度优先遍历实现

　　接下来该说说广度优先遍历的实现过程了。刚才所说的重放是什么意思呢？似乎听起来和回溯差不多？其实，回溯与重放是完全相反的过程。

　　仍然以刚才的图为例，按照广度优先遍历的思想，我们首先遍历顶点0，然后遍历了邻近顶点1、2、3、4：

　　接下来我们要遍历更外围的顶点，可是如何找到这些更外围的顶点呢？我们需要把刚才遍历过的顶点1、2、3、4按顺序重新回顾一遍，从顶点1发现邻近的顶点7、9；从顶点3发现邻近的顶点5、6。

　　像这样把遍历过的顶点按照之前的遍历顺序重新回顾，就叫做重放。同样的，要实现重放也需要额外的存储空间，可以利用队列的先入先出特性来实现。

　　下面我们来演示一下具体实现过程。

　　首先遍历起点顶点0，顶点0入队 —— 遍历队列：0

　　接下来顶点0出队，遍历顶点0的邻近顶点1、2、3、4，并且把它们入队 —— 遍历队列：1-2-3-4

　　然后顶点1出队，遍历顶点1的邻近顶点7、9，并且把它们入队 —— 遍历队列：2-3-4-7-9（1出队，1的邻近点7-9）

　　然后顶点2出队，没有新的顶点可入队 —— 遍历队列：3-4-7-9（1出队，1的邻近点7-9）

　　以此类推，利用这样一个队列来实现重放，最终遍历完所有顶点。

3、代码实现

　　无论是深度优先遍历还是广度优先遍历，当我获取一个顶点若干相邻顶点时，我该如何判断这个顶点有没有被访问过呢？

　　这个问题提的很好，我们可以利用一个数组来存储所有顶点的访问状态。顶点对应元素的初始值都是false，代表未遍历，遍历之后就变为true。

　　下面我们来看一下深度优先遍历和广度优先遍历的完整代码实现：

// 图的顶点
private static class Vertex {
    int data;
    Vertex( int data) {
        this.data = data;
    }
}
// 图（邻接表形式）
private static class Graph{
    private int size;
    private Vertex[] vertexes;
    private LinkedList<Integer> adj[];

    Graph(int size){
        this.size = size;
        //初始化顶点和邻接矩阵
        vertexes = new Vertex[size];
        adj = new LinkedList[size];
        for(int i=0; i<size; i++){
            vertexes[i] = new Vertex(i);
            adj[i] = new LinkedList();
        }
    }
}
// 深度优先遍历
public static void dfs(Graph graph, int start, boolean[] visited) {
    System.out.println(graph.vertexes[start].data);
    visited[start] = true;
    for(int index : graph.adj[start]){
        if(!visited[index]){
            dfs(graph, index, visited);
        }
    }
}
// 广度优先遍历
public static void bfs(Graph graph, int start, boolean[] visited, LinkedList<Integer> queue) {
    queue.offer(start);
    while (!queue.isEmpty()){
        int front = queue.poll();
        if(visited[front]){
            continue;
        }
        System.out.println(graph.vertexes[front].data);
        visited[front] = true;
        for(int index : graph.adj[front]){
            queue.offer(index);;
        }
    }
}


public static void main(String[] args) {
    Graph graph = new Graph(6);

    graph.adj[0].add(1);
    graph.adj[0].add(2);
    graph.adj[0].add(3);

    graph.adj[1].add(0);
    graph.adj[1].add(3);
    graph.adj[1].add(4);

    graph.adj[2].add(0);

    graph.adj[3].add(0);
    graph.adj[3].add(1);
    graph.adj[3].add(4);
    graph.adj[3].add(5);

    graph.adj[4].add(1);
    graph.adj[4].add(3);
    graph.adj[4].add(5);

    graph.adj[5].add(3);
    graph.adj[5].add(4);

    
    System.out.println("图的深度优先遍历：");
    dfs(graph, 0, newboolean[graph.size]);
    
    System.out.println("图的广度优先遍历：");
    bfs(graph, 0, newboolean[graph.size], newLinkedList<Integer>());
}

三、深度优先与广度优先遍历区别对比

1、二叉树的深度优先遍历的非递归的通用做法是采用栈，广度优先遍历的非递归的通用做法是采用队列。

2、深度优先遍历：对每一个可能的分支路径深入到不能再深入为止，而且每个结点只能访问一次。要特别注意的是，二叉树的深度优先遍历比较特殊，可以细分为先序遍历、中序遍历、后序遍历。具体说明如下：

先序遍历：对任一子树，先访问根，然后遍历其左子树，最后遍历其右子树。
中序遍历：对任一子树，先遍历其左子树，然后访问根，最后遍历其右子树。
后序遍历：对任一子树，先遍历其左子树，然后遍历其右子树，最后访问根。

3、广度优先遍历：又叫层次遍历，从上往下对每一层依次访问，在每一层中，从左往右（也可以从右往左）访问结点，访问完一层就进入下一层，直到没有结点可以访问为止。　　　

4、深度优先搜素算法：不全部保留结点，占用空间少；有回溯操作(即有入栈、出栈操作)，运行速度慢。—— 储存空间小，运行慢

5、广度优先搜索算法：保留全部结点，占用空间大；无回溯操作(即无入栈、出栈操作)，运行速度快。—— 存储空间大，运行快

　　通常深度优先搜索法不全部保留结点，扩展完的结点从数据库中弹出删去，这样，一般在数据库中存储的结点数就是深度值，因此它占用空间较少。所以，当搜索树的结点较多，用其它方法易产生内存溢出时，深度优先搜索不失为一种有效的求解方法。

　　广度优先搜索算法，一般需存储产生的所有结点，占用的存储空间要比深度优先搜索大得多，因此，程序设计中，必须考虑溢出和节省内存空间的问题。但广度优先搜索法一般无回溯操作，即入栈和出栈的操作，所以运行速度比深度优先搜索要快些。

6、最后我们来看一个图，写一下搜索步骤：

（1）深度优先遍历：

　　前序遍历：35,20,15,16,29,28,30,40,50,45,55

　　中序遍历：15,16,20,28,29,30,35,40,45,50,55

　　后序遍历：16,15,28,30,29,20,45,55,50,40,35

（2）广度优先遍历：35 20 40 15 29 50 16 28 30 45 55

四、什么时候使用深度优先遍历？什么时候使用广度优先遍历？

　　我理解DFS和BFS之间的区别，但是我很想知道何时使用一个比另一个更实用？

　　比较BFS和DFS，DFS的一大优势是它比BFS具有更低的内存要求，因为没有必要在每个级别存储所有子指针。根据数据和您要查找的内容，DFS或BFS可能是有利的。

　　这在很大程度上取决于搜索树的结构以及解决方案的数量和位置（也就是搜索项目）。

如果您知道解决方案离树的根不远，那么广度优先搜索（BFS）可能会更好。
如果树很深并且解决方案很少，深度优先搜索（DFS）可能需要很长时间，但BFS可能会更快。
如果树很宽，BFS可能需要太多内存，所以它可能完全不切实际。
如果解决方案频繁但位于树的深处，那么BFS可能是不切实际的。
如果搜索树非常深，则无论如何都需要限制深度优先搜索（DFS）的搜索深度（例如，使用迭代加深）。

　　但这些只是经验法则; 你可能需要进行实验。

1、深度优先搜索

　　深度优先搜索通常用于模拟游戏（以及现实世界中类似游戏的情况）。在典型的游戏中，您可以选择几种可能的操作之一。每种选择都会导致进一步的选择，每种选择都会导致进一步的选择，以此类推，形成一种不断扩展的树形可能性图。

　　例如在像国际象棋这样的游戏中，当你决定做出什么样的动作时，你可以在心理上想象一个动作，然后你的对手的可能反应，然后是你的反应，等等。您可以通过查看哪种移动可以获得最佳结果来决定做什么。

　　只有游戏树中的某些路径才能赢得胜利。有些会导致你的对手获胜，当你达到这样的结局时，你必须备份或回溯到前一个节点并尝试不同的路径。通过这种方式，您可以探索树，直到找到成功结束的路径。然后沿着这条路径前进。

2、广度优先搜索

　　广度优先搜索具有一个有趣的属性：它首先找到距起点一个边缘的所有顶点，然后是两个边缘的所有顶点，依此类推。

　　如果您试图找到从起始顶点到给定顶点的最短路径，这将非常有用。您启动BFS，当您找到指定的顶点时，您知道到目前为止您已跟踪的路径是该节点的最短路径。如果路径较短，BFS就已经找到了。

　　广度优先搜索可用于在像对等网络中找到邻居节点，如BitTorrent，用于查找附近位置的GPS系统，用于查找指定距离内的人的社交网站以及类似的东西。

3、当树的深度可以变化时，广度优先搜索通常是最好的方法，并且您只需要搜索树的一部分以获得解决方案。例如，找到从起始值到最终值的最短路径是使用BFS的好地方。

　　当您需要搜索整个树时，通常会使用深度优先搜索。它比BFS更容易实现（使用递归），并且需要更少的状态：虽然BFS要求您存储整个“前沿”，但DFS只需要存储当前元素的父节点列表。

　　DFS比BFS更节省空间，但可能会达到不必要的深度。

参考文章：https://mp.weixin.qq.com/s/WA5hQXkcACIarcdVnRnuiw