二分图匹配

二分图匹配：

含义：把无向图G=(V,E)，分为两个集合V1,V2，所有的边都在V1,V2之间，而V1或V2内部没有边，V1中的一个点与V2中的一个点关联，称为一个匹配。

一个图是不是二分图，一般通过染色判断，用两种颜色对所有顶点染色，如果相邻顶点的颜色都不同那么就是二分图。

ps。一个图是二分图当且仅当它不含边的数量为奇数的点

常见问题：

（1）无权图：求包含边数最多的匹配，求二分图的最大匹配（最大流、匈牙利算法）

（2）带权图：求边权和最大的匹配（KM算法，转化为费用流求解）

QUS1:求二分图的最大匹配

定义：（1）最大匹配：包含边数最多的匹配

　　　（2）完美匹配：所有点都在匹配的边上

做法1：转化为最大流求解

把每个边转化为有向边，流量为1，在V1上加一个人为的源点s（连接所以的V1），在V2上加上一个人为的汇点t（连接所有的V2)，然后求s-->t的最大流即可

POJ 2339 Selecting Courses

由于是求最大匹配，所以可以保证每个时间点只连接一门课程

#include<iostream>
#include<cstring>
#include<cmath>
#include<algorithm>
#include<stack>
#include<cstdio>
#include<queue>
#include<map>
#include<vector>
#include<set>
using namespace std;
const int maxn=1010;
const int INF=0x3fffffff;
typedef long long LL;
typedef unsigned long long ull;
//最大流解决二分图的最大匹配
//虚拟一个源点，到每一条的每个上课时间，7天，12节课，共84个节点，对每个课时选择上哪些课，建立权值为1的边，最后都汇集到虚拟的汇点
//EK求最大流
int mp[410][410];
int pre[410];
int N,M,K;
void input(){
	memset(mp,0,sizeof(mp));
	int n,m,t;
	for(int i=1;i<=N;i++){
		scanf("%d",&t);
		mp[0][i]=1;  //到这门课（源点） 
		for(int j=0;j<t;j++){
			scanf("%d %d",&n,&m); //星期几、第几节课 
			mp[i][N+(n-1)*12+m]=1; //这门课---时间点 
			mp[N+(n-1)*12+m][84+N+1]=1;  //时间点---汇点 
		}
	}
} 
queue<int> que;
bool bfs(int s,int t){
	while(!que.empty()) que.pop();
	que.push(s);
	memset(pre,-1,sizeof(pre));
	pre[s]=0;
	int index;
	while(!que.empty()){
		index=que.front();
		que.pop();
		for(int i=1;i<=t;i++){
			if(mp[index][i]>0&&pre[i]==-1){
				pre[i]=index;
				if(i==t) return 1;
				que.push(i);
			}
		}
	}
	return 0;
}
int ek(int s,int t){
	int summ=0;
	while(bfs(s,t)){
		for(int i=t;i!=s;i=pre[i]){
			mp[pre[i]][i]--;  //正向减 
			mp[i][pre[i]]++; //反向加 
		}
		summ++;
	}
	return summ;  //最大匹配数 
}
int main(){
	while(scanf("%d",&N)!=EOF){
		input();
		printf("%d
",ek(0,84+N+1));
	}
return 0;
}

做法2：匈牙利求解（更简单）

可以看作是最大流的特殊实现，因为二分图是一个很简单的图，所以对s,t的操作是多余的，可以直接从V1开始找增广路径

如果用邻接矩阵：时间O(V^3),空间O（V^2)

如果有邻接表：时间O(VE)，空间O(V+E)

#include<iostream>
#include<cstring>
#include<cmath>
#include<algorithm>
#include<stack>
#include<cstdio>
#include<queue>
#include<map>
#include<vector>
#include<set>
using namespace std;
const int maxn=1010;
const int INF=0x3fffffff;
typedef long long LL;
//匈牙利算法求最大二分图匹配
int g[510][510];
int match[510];   //匹配结果 
int reverb[510]; 
int k,m,m_girl,n_boy;
bool dfs(int x){   //找一个增广路径，给女孩x找一个配对男孩 
 	for(int i=1;i<=n_boy;i++){
		if(!reverb[i]&&g[x][i]){
			reverb[i]=1; //预定男孩，给女孩x
			//上面是
			if(!match[i]||dfs(match[i])){  //情况1：男孩x还没有匹配，就直接分
				                           //情况2：如果男孩i已经配对，尝试dfs更换原有配对，更换成功后，就有属于女孩x
				match[i]=x;
				return true; 
			} 
		}
	}
	return false;  //没有喜欢的男孩  或者  更换不成功 
}


int main(){
	while(scanf("%d",&k)!=EOF&&k){
		scanf("%d %d",&m_girl,&n_boy);
		memset(g,0,sizeof(g));
		memset(match,0,sizeof(match));
		for(int i=0;i<k;i++){
			int a,b;
			scanf("%d %d",&a,&b);
			g[a][b]=1;
		}
		int summ=0;
		for(int i=1;i<=m_girl;i++){
			memset(reverb,0,sizeof(reverb));
			if(dfs(i)) summ++;
		}
		printf("%d
",summ);
	}
	
	
	
return 0;
}

例题：UVA10080 Gopher II

打地鼠

【这个完全是匈牙利算法求最待匹配】

https://www.luogu.com.cn/problem/UVA10080

#include<iostream>
#include<cstring>
#include<cmath>
#include<algorithm>
#include<stack>
#include<cstdio>
#include<queue>
#include<map>
#include<vector>
#include<set>
using namespace std;
const int maxn=105;
const int INF=0x3fffffff;
typedef long long LL;
typedef unsigned long long ull;
/*
题意：每只地鼠要走到距离小于等于v*t的洞里，问最少有几只地鼠会被抓走
一只地鼠一个洞，显然二分图最大匹配
建图：时间复杂度Θ（n^2）每个地鼠都暴力算一遍每个洞的哈密顿距离
二分图匹配： 匈牙利算法
当把地鼠和洞穴连边建成一个二分图后，这个二分图的最大匹配就是能躲进洞穴的地鼠的最大个数，最后我们输出 n-(最大匹配) 即可
*/ 
int n,m,s,vi;
int mp[maxn][maxn];
int match[maxn];
double xx[maxn],yy[maxn];
bool vis[maxn];
double dis(double x1,double y1,double x2,double y2){
	return sqrt(pow(x1-x2,2)+pow(y1-y2,2));
}
void input(){
	memset(mp,0,sizeof(mp));
	memset(match,0,sizeof(match));
	for(int i=1;i<=n;i++){
		scanf("%lf %lf",&xx[i],&yy[i]); //地鼠的位置 
	}
	for(int i=1;i<=m;i++){
		double x,y;
		scanf("%lf %lf",&x,&y);
		for(int j=1;j<=n;j++){
			if(dis(x,y,xx[j],yy[j])<=vi*s){
				mp[j][i]=1;
				//地鼠-->洞 
			}
		}
	}
}
bool dfs(int p){  //地洞 
	int tmp;
	for(int i=1;i<=n;i++){
		if(mp[i][p]&&!vis[i]){
			vis[i]=1;
			tmp=match[i];
			match[i]=p;
			if(tmp==0||dfs(tmp)) return 1;
			match[i]=tmp; //回溯 
		}
	}
	return 0;
}
void ek(){
	int res=0;
	for(int i=1;i<=m;i++){
		memset(vis,0,sizeof(vis));
		res+=dfs(i);
		//cout<<res<<endl;
	}
	printf("%d
",n-res);
}
int main(){
	while(scanf("%d %d %d %d",&n,&m,&s,&vi)!=EOF){
		input();
		ek();
	}
return 0;
}

　相关的几个问题：

（1）最小路径覆盖：一个不含圈的有向图G中，G的一个路径覆盖是一个其节点不相交的路径集合P，图中的每一个节点仅包含于P中的某一条路径。求一个不含圈的有向图G的最小路径覆盖书

最小路径覆盖数=G的定点数-最小路径覆盖中的边数

how？拆点：把每个顶点拆为Xi，Yi然后连边，所求出的二分图的最大匹配数则为原图G的最小路径覆盖中的边数

so-----> 最小路径覆盖数=G的定点数-二分图的最大匹配数

（2）最小点集覆盖：最少的点让每条边都至少和其中一个点关联：

so----->最小点集覆盖=最大匹配

（3）最大独立集：

在N个点的图G中选出m个点，使这m个点两两之间没有边，求m最大值

二分图的最大独立集=节点数n-最大匹配数

二分图最优匹配：

又称带权最大匹配，每条边有权值，求最大权值和，若X,Y顶点集合个数相同，那么最优匹配也是一个完备匹配，如果个数不相等，可以通过加补点加0边实现转化。

KM算法（对匈牙利算法的贪心拓展）：

给每个顶点可行顶标，对所有的边(i,j)都有lx[i]+ly[j]>=w[i,j]成立，且对所有在完备匹配M中的边(i,j),都有lx[i]+ly[j]=w[i,j]成立，则M是图G的一个最佳匹配

如果X于Y中节点个数相同并且所有点的度数都相等则一定存在完备匹配，否则补点加0边

how？

欲求完全二分图的最佳匹配，只要有匈牙利算法求其相等子图的完备匹配即可，逐次修改可行顶标的方法使对于的相等子图之最大匹配逐次增广，最后出现完备匹配。

解释https://www.cnblogs.com/logosG/p/logos.html

一些题目https://www.cnblogs.com/skyming/archive/2012/02/18/2356919.html

伪代码：

int lx[maxn],ly[maxn],sx[maxn],sy[maxn],match[maxn];
int n,m;
bool path(int u){  //匈牙利
	sx[u]=1;
	for(int v=0;v<n;v++){
		if(!sy[v]&&lx[u]+ly[v]==wei[u][v]){
			sy[v]=1;
			if(match[v]==-1||path(match[v])){
				match[v]=u;
				return 1;
			}
		}
	} 
	return 0;
} 
int bestmatch(){
	int i,j;
	for(i=0;i<n;i++){
		lx[i]=-INF;
		ly[i]=0;  //初始值
		for(j=0;j<n;j++){
			if(lx[i]<wei[i][j]){
				lx[i]=wei[i][j];
			}
		} 
	}
	memset(match,-1,sizeof(match));
	for(int u=0;u<n;u++){
		memset(sx,0,sizeof(sx));
		memset(sy,0,sizeof(sy));
		if(path(u)){
			break; //匹配成功，跳出进行下一个顶点的匹配 
		}
		int dx=INF;
		for(i=0;i<n;i++){
			if(sx[i])
				for(j=0;j<n;j++){
					if(!sy[j]){
						dx=min(lx[i]+ly[j]-wei[i][j],dx);
					}
				}
				for(j=0;j<n;j++){
					if(sx[j])  //对于访问过的x节点
					lx[j]-=dx; 
					if(sy[j]) //对于访问过的y节点
					ly[j]+=dx; 
				}	
		}
	}
}


int main(){
return 0;
}

代码：

#include<iostream>
#include<cstring>
#include<cmath>
#include<algorithm>
#include<stack>
#include<cstdio>
#include<queue>
#include<map>
#include<vector>
#include<set>
using namespace std;
const int maxn=1010;
const int INF=0x3fffffff;
typedef long long LL;
typedef unsigned long long ull;
int love[maxn][maxn];   // 记录每个妹子和每个男生的好感度
int ex_girl[maxn];      // 每个妹子的期望值
int ex_boy[maxn];       // 每个男生的期望值
bool vis_girl[maxn];    // 记录每一轮匹配匹配过的女生
bool vis_boy[maxn];     // 记录每一轮匹配匹配过的男生
int match[maxn];        // 记录每个男生匹配到的妹子 如果没有则为-1
int slack[maxn];        // 记录每个汉子如果能被妹子倾心最少还需要多少期望值
int n;
bool dfs(int gg){
	vis_girl[gg]=1;
	for(int i=0;i<n;i++){
		if(vis_boy[i]) continue;
		int gap=ex_girl[gg]+ex_boy[i]-love[gg][i];
		if(gap==0){
			vis_boy[i]=true;
			if(match[i]==-1||dfs(match[i])){   // 找到一个没有匹配的男生 或者该男生的妹子可以找到其他人
				match[i]=gg;
				return 1;
			}
			else{
				slack[i]=min(slack[i],gap);
				 // slack 可以理解为该男生要得到女生的倾心 还需多少期望值 取最小值
			}
		}
	}
	return false;
}
int km(){
	memset(match,-1,sizeof(match));
	memset(ex_boy,0,sizeof(ex_boy));// 初始每个男生的期望值为0
	   // 每个女生的初始期望值是与她相连的男生最大的好感度
	for(int i=0;i<n;i++){
		ex_girl[i]=love[i][0];
		for(int j=1;j<n;j++){
			ex_girl[i]=max(ex_girl[i],love[i][j]);
		}
	}
	// 尝试为每一个女生解决归宿问题
	for(int i=0;i<n;i++){
		fill(slack,slack+n,INF);// 因为要取最小值 初始化为无穷大
		while(1){
			// 为每个女生解决归宿问题的方法是 ：如果找不到就降低期望值，直到找到为止
			memset(vis_girl,false,sizeof(vis_girl));
			memset(vis_boy,false,sizeof(vis_boy));
			if(dfs(i)) break;// 找到归宿 退出

            // 如果不能找到 就降低期望值
            // 最小可降低的期望值
            int d=INF;
            for(int j=0;j<n;j++){
            	if(!vis_boy[j]) d=min(d,slack[j]);
			}
			for(int j=0;j<n;j++){
				// 所有访问过的女生降低期望值
				if(vis_girl[j]) ex_girl[j]-=d;
				// 所有访问过的男生增加期望值
				if(vis_boy[j]) ex_boy[j]+=d;
				// 没有访问过的boy 因为girl们的期望值降低，距离得到女生倾心又进了一步
				else slack[j]-=d;
			}
		}
	}
	int res=0;
	for(int i=0;i<n;i++) res+=love[match[i]][i];
	return res;
}


int main(){
	while(scanf("%d",&n)!=EOF){
		for(int i=0;i<n;i++){
			for(int j=0;j<n;j++) scanf("%d",&love[i][j]);
		}
	}
	printf("%d
",km());
return 0;
}

费用流解决最优匹配

两种不同的建图方式，可以得到不同的解

（1）按照求最大匹配的建边方式，求出来的是最佳匹配（一定是完备匹配），因为S-X集合的每一条边都满流

建图：

添加超级源点S,超级汇点T，从S向二分图X集合中的每个顶点连接一条权值为0，容量为1的有向边，从Y集合向T连接一条权值为0，容量为1的有向边，然后把原有的边变成容量为1，权值不变的有向边，求从S到T的最小（大）费用流，就能得到最小（大）匹配

例题：

【n个玩具在m台机器上面加工，给出每个玩具在每台机器上面的加工时间，每台机器同一时间只能加工一个玩具，求加工完所有的玩具所需的平均时间】

这道题的建边思想也很不错，不知道前面有多少个玩具在加工，那么就枚举耽误了后面的玩具多少时间，枚举自己是倒数第i个加工的，那么所需总时间就是i*time

所以玩具i连接工厂j要连n条边，边权分别是k*time[i][j](k=1,2,3...n)

#include<iostream>
#include<cstring>
#include<cmath>
#include<algorithm>
#include<stack>
#include<cstdio>
#include<queue>
#include<map>
#include<vector>
#include<set>
using namespace std;
const int maxn=1010;
int INF=0x3fffffff;
typedef long long LL;
typedef unsigned long long ull;
//这道题的建边思想也很不错，不知道前面有多少个玩具在加工，那么就枚举耽误了后面的玩具多少时间，枚举自己是倒数第i个加工的，那么所需总时间就是i*time
//所以玩具i连接工厂j要连n条边，边权分别是k*time[i][j](k=1,2,3...n) 
struct node{
	int x,y,flow,cost,nex,op; //op是相反的那条便 
}mp[1500000];
int tot,st,ed,n,m,head,tail,test;
double ans;
int que[200000000],headd[3000],f[3000],pre[3000];
bool vis[3000];
int data[51][51];
void build(int x,int y,int cost){
	tot++;
	mp[tot].x=x;mp[tot].y=y;mp[tot].flow=1;mp[tot].cost=cost;
	mp[tot].op=tot+1;
	mp[tot].nex=headd[x];
	headd[x]=tot;
	tot++;
	mp[tot].x=y;mp[tot].y=x;mp[tot].flow=0;mp[tot].cost=-cost;
	mp[tot].op=tot-1;
	mp[tot].nex=headd[y];
	headd[y]=tot;
}
void inti(){
	scanf("%d %d",&n,&m);
	for(int i=1;i<=n;i++){
		for(int j=1;j<=m;j++) scanf("%d",&data[i][j]);
	}
	tot=0;
	memset(headd,0,sizeof(headd));
	for(int i=1;i<=n;i++){
		int temp=n; //要用这后面的数字 
		for(int j=1;j<=m;j++){
			for(int k=1;k<=n;k++){
				temp++;
				build(i,temp,data[i][j]*k);
			}
		}
	}
	st=n+n*m+1;
	ed=st+1;
	//超级源点连接 
	for(int i=1;i<=n;i++) build(st,i,0);
	for(int i=n+1;i<=n*m+n;i++) build(i,ed,0);
	ans=0;
	memset(pre,0,sizeof(pre));
}
bool spfa(){
	memset(f,100,sizeof(f));
	INF=f[0];
	memset(vis,false,sizeof(vis));
	head=1,tail=1;
	f[st]=0;vis[st]=1;
	que[1]=st;
	pre[st]=-1;
	while(head<=tail){ //找增广路 
		int x=que[head];
		vis[x]=0;
		for(int i=headd[x];i;i=mp[i].nex){
			int y=mp[i].y;
			if(f[x]+mp[i].cost<f[y]&&mp[i].flow){
				f[y]=f[x]+mp[i].cost;
				pre[y]=i;  //pre是记录的边！！！！ 
				if(vis[y]==false){
					vis[y]=true;
					tail++;
					que[tail]=y;
				}
			}
		}
		head++;
	}
	if(f[ed]<INF){
		int t=pre[ed];
		ans+=f[ed];
		while(t!=-1){
			mp[t].flow-=1;
			mp[mp[t].op].flow++;
			t=pre[mp[t].x];
		}
		return true;
	}
	else return false;
}
int main(){
	scanf("%d",&test);
	while(test--){
		inti();
		while(spfa()){
			ans=ans/n;
			printf("%.6lf
",ans);
		}
	}
return 0;
}

（2）如果要求最大权匹配（不一定完备匹配），那么只需要再引入一个顶点A，从X集合的每个顶点向A连接一条容量为1，权值为0的边，然后再有A向T连接一条权值为0，容量不小于|X|的边，求最大费用最大流（分流思想）