km算法的个人理解

首先相对于上个blog讲的匈牙利算法用于解决无权二分图的最佳匹配,km算法则是在匈牙利算法基础上更进一层的,每条边增加了权值后,真的开始看时有些无厘头,觉得没有什么好方法,但两位牛人Kuhn-Munkras在1957年提出的，而匈牙利算法是在1965年提出的,

终于翻了图书馆3本书的讲解和无数网上牛人的讲解,终于看懂的,这当然是后话.

首先km算法是在匈牙利算法基础上运行的,本质上km算法大致意思就是先将x集合中每条边连接上其所能连接的最大权值边,如果没有冲突,当然是正确的,有的话,也别急,现在我们要做的是将这个ans逐渐缩小,然后将冲突的边调开,直到满足二分图完备匹配(这个地方用匈牙利算法求最大匹配,若最大匹配是完备匹配,就满足)的时候,此时便是正确的答案.

至于如何将冲突的边进行调整,才能使ans缩小得刚好,又能够使得x集合能够找到各自的y取得最大权值,因此我们给每个x,y集合上的点引入一个可行顶标lx[],ly[],当初就是不明白为什么需要引入这两个顶标才搞了很久,顾名思义,可行顶标就是用来判断当前点是否可行,km算法中即根据lx[i]+ly[j]的大小判断是否I,j能够连接.

可能我们先来证明一个定理会更容易理解km算法:

w[I,j]表示i到j的权值,设W=(wij)(i∈x,j∈y),其中排列{jk1,jk2…,jkn},使最大匹配M=(wij)(其中(in,jkn)连接) ,存在{lx[i]},{ly[j]},满足lx[i]+ly[j]>=w[I,j],且其中lx[in]+ly[jkn]=w[In,jn], 最佳匹配的权值和max(sigma(wij))=min(sigma(lx[])+sigma(ly[]))

举个例子好理解:

wij	j1	j2	j3
i1	3	2	*
i2	2	*	1
i3	*	1	2

一开始我们令所有x集合lx[i]=max(w[i,j]),ly[j]=0,则保证lx[i]+ly[j]>=w[i,j],然后我们通过一个表格来表示x和y之间的关系,

则lx[1]=3lx[2]=2 lx[3]=2 ly[]=0

然后做一个表格表示lx[i]+ly[j]-w[i,j]

lx[i]-ly[j]-w[i,j]	j1	j2	j3
i1	0	1	*
i2	0	*	1
i3	*	1	0

因为要保证lx[i]+ly[j]>=w[i,j]所以我们只匹配lx[i]+ly[j]=w[i,j]的边,即其他lx[i]+ly[j]>w[i,j]的边先去除.

说明:仔细想想,当前这个情况若满足每个0都在不同行不同列,是不是当前这个情况就是最佳匹配,因为现在每个x都选到了最大的y,显然没有比这个更大的匹配了,不过情况比这个复杂些,其中i1,i2都和j1匹配,产生冲突,所以我们应该修正.

是不是有点感觉了,仔细想想,现在我们应该增大0的个数使得存在不同行不同列的0有n个,因为0即表示可以匹配,所以是不是感觉到可以使用匈牙利算法来找出不同行不同列0的个数,只要等于n即表示当前这个ans=max(sigma(wij))是最优的.

不过当前情况不符合匹配,所以我们要适当缩小ans,使得ans缩小到下一个状态,在这个状态中至少要多出一个0,而且其他边的lx[],ly[]不要影响这些的状态,

因此要得到至少多出一个0,我们得将表格中最小的正整数min=(1,1,1)=1减掉,

现在我们是到i2时发现冲突,因此我们得调整lx,ly,然后重新用匈牙利算法匹配,

{入交错图指入队如上述第一步中i1,i2入了交错图形成i1-j1-i2,现在将入交错图的x点集合为sx,入交错图的y点集合为sy}

这样我们也就是要将i1或者i2与其他的j匹配,所以我们将sx上的点即i1,i2的lx[]下调1,然后将sy的点即j1的ly[]上调1,

这样的话我们得到

lx[1]=2lx[2]=1 lx[3]=2 ly[1]=1 ly[2]=0 ly[3]=0

lx[i]-ly[j]-w[i,j]	j1	j2	j3
i1	0	0	*
i2	0	*	1
i3	*	1	0

多出一个0,现在匈牙利算法计算时就满足完备匹配了ok

我搞的这个数据不太好,一步到位…,不过足以说明了

然后说明一下为什么这样调保证即使还得继续调整也是正确:每次有匹配冲突时,表示x集合上有一点p无法再插入sx中,我们暂时把它当做入了sx,我们得为他或者其他入交错图的x找到一个匹配,p才能真正入sx. 但是原来的0(原来的边)不能被删除,故我们将sy中的点ly+min这样就保证原来的lx+ly=w,原来的边依旧可以用

其中因为|sx|=|sy|+1;sigma(lx[])+sigma(ly[])比之前减少了min*(|sx|-|sy|)=min

也就是:

对于sx,sy上点:lx-min+ly+min=lx+ly不变

对于sx,非sy上点:lx-min+ly<lx+ly缩小也就使得边多出来

对于非sx,sy上点:lx+ly+min>lx+ly又lx+ly>=w,故lx+ly+min依旧满足>=w

对于非sx,非sy上点:无影响

将{sx}上点lx[i]均-min不是就使得在{sx}与{非sy}之间至少出现一条使得lx[i]+ly[j]=w[i,j],即多出至少一条边,从上述表格形式即多出一个0,而且我们是将下一个多出0的情况找到,故这满足最佳匹配.

因此只要经过有限次的重复上述步骤可达到求得min(sigma(lx[])+sigma(ly[]))

即ans

补上代码:

#include<iostream>
#include<cstdio>
#include<string.h>
using namespace std;
int lx[200],ly[200],w[200][200],pre[200];
int n,ans,mi;
bool sx[200],sy[200];
bool path(int p){
    sx[p]=1;
    int i;
    for(i=1;i<=n;i++)
    if (!sy[i]&&lx[p]+ly[i]==w[p][i]){
        sy[i]=1;//此处要记得将i入sy,否则之后path会挂的...找了很久...
        if (pre[i]==0||path(pre[i])){
            pre[i]=p;
            return 1;
        }
    }
    return 0;
}
int main()
{
    int i,j,k;
    scanf("%d",&n);
    for(i=1;i<=n;i++)
        for(j=1;j<=n;j++){
        scanf("%d",&w[i][j]);
        w[i][j]=w[i][j];
        if (w[i][j]>lx[i]) lx[i]=w[i][j];
    }
    for(i=1;i<=n;i++){
        memset(sx,0,sizeof(sx));
        memset(sy,0,sizeof(sy));
        while (!path(i)){
            mi=2000000000;
            for(j=1;j<=n;j++)
                for(k=1;k<=n;k++)
                if (sx[j]&&!sy[k]){
                    if (lx[j]+ly[k]-w[j][k]<mi) mi=lx[j]+ly[k]-w[j][k];
                }
            for(j=1;j<=n;j++) if(sx[j]) lx[j]-=mi;
            for(j=1;j<=n;j++) if(sy[j]) ly[j]+=mi;
            memset(sx,0,sizeof(sx));
            memset(sy,0,sizeof(sy));
        }
    }
    for(i=1;i<=n;i++)
        ans+=lx[i]+ly[i];
    printf("%d",ans);
    return 0;
}

那么多的束缚，我不曾放弃过；那么多的险阻，我不曾倒下过。