KM 最优匹配讲解

转：

基本原理

　　该算法是通过给每个顶点一个标号（叫做顶标）来把求最大权匹配的问题转化为求完备匹配的问题的。设顶点Xi的顶标为A[ i ]，顶点Yj的顶标为B[ j ]，顶点Xi与Yj之间的边权为w[i,j]。在算法执行过程中的任一时刻，对于任一条边(i,j)，A[ i ]+B[j]>=w[i,j]始终成立。

　　KM算法的正确性基于以下定理：

　　若由二分图中所有满足A[ i ]+B[j]=w[i,j]的边(i,j)构成的子图（称做相等子图）有完备匹配，那么这个完备匹配就是二分图的最大权匹配。

　　这个定理是显然的。因为对于二分图的任意一个匹配，如果它包含于相等子图，那么它的边权和等于所有顶点的顶标和；如果它有的边不包含于相等子图，那么它的边权和小于所有顶点的顶标和。所以相等子图的完备匹配一定是二分图的最大权匹配。

　　初始时为了使A[ i ]+B[j]>=w[i,j]恒成立，令A[ i ]为所有与顶点Xi关联的边的最大权，B[j]=0。如果当前的相等子图没有完备匹配，就按下面的方法修改顶标以使扩大相等子图，直到相等子图具有完备匹配为止。

　　我们求当前相等子图的完备匹配失败了，是因为对于某个X顶点，我们找不到一条从它出发的交错路。这时我们获得了一棵交错树，它的叶子结点全部是X顶点。现在我们把交错树中X顶点的顶标全都减小某个值d，Y顶点的顶标全都增加同一个值d，那么我们会发现：

　　1）两端都在交错树中的边(i,j)，A[ i ]+B[j]的值没有变化。也就是说，它原来属于相等子图，现在仍属于相等子图。

　　2）两端都不在交错树中的边(i,j)，A[ i ]和B[j]都没有变化。也就是说，它原来属于（或不属于）相等子图，现在仍属于（或不属于）相等子图。

　　3）X端不在交错树中，Y端在交错树中的边(i,j)，它的A[ i ]+B[j]的值有所增大。它原来不属于相等子图，现在仍不属于相等子图。

　　4）X端在交错树中，Y端不在交错树中的边(i,j)，它的A[ i ]+B[j]的值有所减小。也就说，它原来不属于相等子图，现在可能进入了相等子图，因而使相等子图得到了扩大。

　　现在的问题就是求d值了。为了使A[ i ]+B[j]>=w[i,j]始终成立，且至少有一条边进入相等子图，d应该等于：

　　Min{A[ i ]+B[j]-w[i,j] | Xi在交错树中，Yi不在交错树中}。

改进

　　以上就是KM算法的基本思路。但是朴素的实现方法，时间复杂度为O(n4)——需要找O(n)次增广路，每次增广最多需要修改O(n)次顶标，每次修改顶标时由于要枚举边来求d值，复杂度为O(n2)。实际上KM算法的复杂度是可以做到O(n3)的。我们给每个Y顶点一个“松弛量”函数slack，每次开始找增广路时初始化为无穷大。在寻找增广路的过程中，检查边(i,j)时，如果它不在相等子图中，则让slack[j]变成原值与A[ i ]+B[j]-w[i,j]的较小值。这样，在修改顶标时，取所有不在交错树中的Y顶点的slack值中的最小值作为d值即可。但还要注意一点：修改顶标后，要把所有的不在交错树中的Y顶点的slack值都减去d。

Kuhn－Munkras算法流程：

　　(1)初始化可行顶标的值

　　(2)用匈牙利算法寻找完备匹配

　　(3)若未找到完备匹配则修改可行顶标的值

　　(4)重复(2)(3)直到找到相等子图的完备匹配为止

 1 bool find(int x)
 2 {//匈牙利算法寻找x的增广路径 
 3 //以x为根的M的交错树 
 4 //看来本算法需要二部图两部分的顶点个数都相等吧 
 5     int y, t;
 6     visitx[x] = true;
 7     for( y = 0; y < N; y++ )
 8     {
 9        if( visity[y] ) continue;//找增广路径的过程中不妨问已经访问过的顶点 
10        t = lx[x] + ly[y] - w[x][y];//是在等子图中寻找匹配的增广路径 
11        if( t == 0 )
12        {
13           visity[y] = true;
14           if( linky[y] == -1 || find(linky[y]) )
15           {
16              linky[y] = x;
17              return true;
18           }
19        }
20         else
21         {//因为本来就需要将一条x顶点在交错树中，y顶点不在交错树中的边扩展进交错树来
22         //所以只改变这些不在等子图中的边的y顶点的松弛量 
23            if( slack[y] > t )
24            slack[y]=t;
25         }
26      }
27      return false;
28 }
29 //外层的匈牙利算法需要O(2)的时间，而修改顶标时由于要枚举所有的边所以也需要O(2)的时间
30 //所以总时间是O(4) 
31 //引入松弛量以后改变顶标就不需要枚举每一条边，只需要枚举不在交错树中的y的松弛量，所以
32 //时间复杂度降为O(3) 
33 void KM()
34 {//KM算法寻找图的最大权匹配 
35      int i, j, x, d;
36      memset(linky,-1,sizeof(linky));
37      memset(lx,0,sizeof(lx)); //x的顶标 
38      memset(ly,0,sizeof(ly));//y的顶标 
39      for( i = 0; i < N; i++)
40         for( j = 0; j < N; j++ )
41            if( map[i][j] > lx[i] )
42              lx[i] = map[i][j];//一开始x的顶标为所有与x相连的边中权值最大的边的权值，y的顶标为0 
43         for( x = 0; x < N; x++ )
44         {//在匈牙利算法中从每个x出发寻找增广路，如果找到就在匹配值上加1，这是为了寻找最大匹配
45         //而在此处，必须找到完备匹配，所以对于每一个x中的顶点，找到其增广路就跳出，找不到的话
46         //就需要修改顶标值直至找到为止 
47             for( i = 0; i < N; i++ )
48                slack[i] = INF;//松弛变量 
49            while (true)
50            {//无限循环直至找到完备匹配 
51                 memset(visitx, 0, sizeof(visitx));//visx为真表示的是该顶点是匹配中的顶点 
52                 memset(visity, 0, sizeof(visity));//y同理 
53                 if( find(x) ) break;
54                 d = INF;
55                 for( i = 0; i < N; i++) 
56                 {
57                    if ( !visity[i] )//注意是取所有不在交错树中的y顶点的松弛量的最小值作为d的值 
58                      if ( d > slack[i] )
59                         d = slack[i];
60                 }
61                 for( i = 0; i < N; i++ )
62                 {
63                    if( visitx[i] )
64                      lx[i] -= d;
65                 }
66                 for( i = 0; i < N; i++ )
67                 {
68                    if( visity[i] )
69                    ly[i] += d;
70                    else
71                    slack[i] -= d;
72                 }
73             }
74         }
75 }

KM 最优匹配 讲解

KM 最优匹配讲解