浅谈保序回归问题

说在前头

本篇博客仅仅介绍保序回归问题最简单问题的解法,对于保序回归问题中的许多证明以及拓展延伸都略过不谈,详情请参见2018国家集训队论文《浅谈保序回归问题》(高睿泉)。

保序回归问题

定义

给定正整数 (k),以及一张点集为 (V),边集为 (E)(DAG) G,点 (i) 有权值 (a_i,w_i)

请为每个点赋一个点值 (f_i),使得对于任意边 ((u,v)in E)(f_ule f_v),且 (sum_{i}w_i|f_i-a_i|^k) 最小。

对于相同的 (k),我们称之为 (L_k) 问题。

一般解法

对于树上情况有特殊的做法,但与一般解法关系不大,在此不作讨论。

考虑整体二分,同时二分出所有点的 (f_i),设当前正在进行 (solve(V,l,r)),表示正在求点集 (V) 的权值,且已经确定它们 (f_i) 的取值为 ([l,r]),令 (mid=dfrac{l+r}{2}),找一个极小值 ( heta)( heta) 的大小根据题目要求而定)。考虑求出哪些点的 (f) (in [l,mid]),哪些点的 (fin [mid+ heta,r]),然后对两边递归处理。

构造另一个问题,在这个问题中,我们只考虑 (V) 中的点,且 (V) 中的点的 (f) 取值只能为 ({mid,mid+ heta}) ,在此基础上满足原题限制时求出最小回归代价。

此时不加证明给出一个引理(证明请参考开头的论文):

(solve(V,l,r)) 的最优解为({b_i}),那么将 (b_i) 中所有 (le mid) 的都替换为 (mid)(>mid) 的都替换为 (mid+ heta) ,得到的新解 ({c_i}) 是新问题的最优解。由此我们只需要解决新问题,就能将 (fle mid)(>mid) 的部分分离开来了。

对于新问题的求解,对于原图中的边 (u ightarrow v),如果 (u)(mid+ heta),那么 (v) 必须取 (mid+ heta)。在此基础上最小化回归代价,这就是经典的最小闭合子图问题,可以使用网络流算法来完成。

特殊解法

  • 对于树上的情况,可以 (DP) 维护分段函数解决,具体参见论文。
  • (p=1) 时,最终答案的取值一定为整数,因此 ( heta) 可以取 (1)
  • 当图为树/基环树时有 (mathcal O(nlog n)) 做法,具体请参见下方 (loj 2470) 的题解。

例题

洛谷P6621 [省选联考 2020 A 卷] 魔法商店

Description

(n) 件物品,有权值 (c_i),价格 (v_i)。定义一个物品集合合法当且仅当且非空、其中所含的物品权值线性无关且集合大小尽量的大。给定两个符合条件的集合 (A,B),你可以花费 (sum_i (x_i-v_i)^2) 的代价,将物品价格改为 ({x_i})(x_i) 必须为整数。请你花费最小代价使得 (A) 为所有合法集合中价格总和最小的,(B) 为价格总和最大的。

(nle 1000,|A|=|B|le 64,c_i<2^{64},v_ile 10^6)

Solution

考虑找到所有的合法集合,这是非常困难的,但是注意到题目中已经给出了一个合法集合 (A),考虑在 (A) 的基础上删掉一些物品再加入一些物品得到合法集合。注意到,这样所有在 (A) 的基础上只修改一个物品得到的合法集合权值都比 (A) 大,那么 (A) 就是价格最小的。

因此,我们只考虑改变哪些物品能使得集合依然合法,枚举改变的元素 (i),再枚举新元素 (j) 插入 (A) 其他元素组成的线性基中,若 (j) 能被表示出来,那么 (i) 的权值必须 (le j)。对 (B) 同样处理。最终我们就得到了一个偏序关系的 (DAG),直接使用上面的保序回归问题算法即可。由于需要保证修改价格为整数,因此令 ( heta=1)

Code

#include<bits/stdc++.h>
using namespace std;
const int N=1010;
typedef unsigned long long ull;
typedef long long ll;
const ll inf=1e16;
int n,m,pd[N],v[N],a[N],b[N],mx,f[N],w[N];
ull c[N],d[N];
vector<int> to[N];
inline bool insert(ull x,bool tp){
	for(int i=63;i>=0;--i){
		if(x&(1ull<<i)){
			if(d[i]) x^=d[i];
			else{tp?d[i]=x:0;return false;}
		}
	}
	return true;
}
inline void init(){
	for(int i=1;i<=m;++i){
		memset(d,0,sizeof(ull)*(64));
		for(int i=1;i<=n;++i) pd[i]=0;
		for(int j=1;j<=m;++j){
			pd[a[j]]=1;
			if(i!=j) insert(c[a[j]],1);
		}
		for(int j=1;j<=n;++j) 
			if(!pd[j])
				if(!insert(c[j],0)) to[a[i]].push_back(j);
	}
	for(int i=1;i<=m;++i){
		memset(d,0,sizeof(ull)*(64));
		for(int i=1;i<=n;++i) pd[i]=0;
		for(int j=1;j<=m;++j){
			pd[b[j]]=1;
			if(i!=j) insert(c[b[j]],1);
		}
		for(int j=1;j<=n;++j) 
			if(!pd[j])
				if(!insert(c[j],0)) to[j].push_back(b[i]);
	}
}

namespace flow{
	struct node{
		int v,nxt,f;
	}e[N*N];
	int first[N],cnt=1,tot,s,t,cur[N],q[N],l,r,dis[N];
	inline void add(int u,int v,int f){e[++cnt].v=v;e[cnt].f=f;e[cnt].nxt=first[u];first[u]=cnt;}
	inline void Add(int u,int v,int f){add(u,v,f);add(v,u,0);}
	inline void init(){
		memset(first+1,0,sizeof(int)*(tot));
		tot=0;cnt=1;
	}
	inline bool bfs(){
		fill(dis+1,dis+tot+1,-1);
		l=1;r=0;q[++r]=s;dis[s]=0;
		while(l<=r){
			int u=q[l++];
			for(int i=first[u];i;i=e[i].nxt){
				int v=e[i].v;
				if(e[i].f&&dis[v]==-1){
					dis[v]=dis[u]+1;
					q[++r]=v;
				}
			}
		}
		return dis[t]!=-1;
	}
	inline int dfs(int u,int f){
		if(!f||u==t) return f;
		int used=0;
		for(int& i=cur[u];i;i=e[i].nxt){
			int v=e[i].v;
			if(e[i].f&&dis[v]==dis[u]+1){
				ll fl=dfs(v,min(f,e[i].f));
				used+=fl;f-=fl;
				e[i].f-=fl;e[i^1].f+=fl;
				if(!f) break;
			}
		}
		if(f) dis[u]=-1;
		return used;
	}
	inline ll dinic(int S,int T){
		ll f=0;s=S;t=T;
		while(bfs()){
			memcpy(cur,first,sizeof(int)*(tot+1));
			f+=dfs(s,inf);
		}
		return f;
	}
}
using flow::Add;
using flow::tot;
int q[N],st[N];
inline ll calc(int i,int x){return 1ll*(x-v[i])*(x-v[i]);}
inline void solve(int ql,int qr,int l,int r){
	if(l==r){
		for(int i=ql;i<=qr;++i) f[q[i]]=l;
		return ; 
	}
	if(ql>qr) return ;
	int mid=(l+r)>>1;
	flow::init();tot=qr-ql+1;
	int s=++tot,t=++tot;
	for(int i=ql;i<=qr;++i) pd[q[i]]=i-ql+1;
	for(int i=ql;i<=qr;++i){
		int u=q[i];
		for(int i=0;i<to[u].size();++i){
			int v=to[u][i];
			if(pd[v]) Add(pd[u],pd[v],inf);
		}
		ll w=calc(u,mid)-calc(u,mid+1);
		if(w>0) Add(s,pd[u],w);
		else Add(pd[u],t,-w);
	}
	flow::dinic(s,t);
	int L=ql,R=qr;
	for(int i=ql;i<=qr;++i){
		int u=q[i];
		if(flow::dis[pd[u]]!=-1) st[R--]=u;
		else st[L++]=u;
		pd[u]=0;
	}
	for(int i=ql;i<=qr;++i) q[i]=st[i];
	solve(ql,L-1,l,mid);solve(L,qr,mid+1,r);
}
int main(){
	scanf("%d%d",&n,&m);
	for(int i=1;i<=n;++i) scanf("%llu",&c[i]),w[i]=1;
	for(int i=1;i<=n;++i) scanf("%d",&v[i]),mx=max(mx,v[i]);
	for(int i=1;i<=m;++i) scanf("%d",&a[i]);
	for(int i=1;i<=m;++i) scanf("%d",&b[i]);
	init();
	for(int i=1;i<=n;++i) q[i]=i;
	solve(1,n,0,mx);
	ll ans=0;
	for(int i=1;i<=n;++i) ans+=calc(i,f[i]);
	printf("%lld
",ans);
	return 0;
}

loj#2470. 「2018 集训队互测 Day 2」有向图

Description

树或基环树上的 (L_1) 问题。

(nle 30000,min {n-1,n})

Solution

首先直接保序回归显然可行,但复杂度太高,考虑优化网络流求解最小闭合子图的过程。

考虑 (DP),首先对于树的情况,将图看成无向图,设 (f_{u,0/1}) 表示只考虑 (u) 的子树,(u) 权值为 (mid+0/1) 时的最小回归代价,那么有转移:

转移边为 (uge v)

[f_{u,0}+= f_{v,0},f_{u,1}+=max(f_{u,0},f_{v,1}) ]

(ule v)

[f_{u,1}+= f_{v,1},f_{u,0}+=max(f_{u,0},f_{v,1}) ]

直接 (DP) 即可做到 (mathcal O(n))

对于基环树的情况,先随机钦定一个环上的点作为根进行 (DP),但这样会漏考虑环上的最后一条边,不妨设根为 (rt),最后一条边为 ((rt,u))。因此再开一维维护根的状态,当遍历到 (u),若这条边为 (rt<v),那么将 (f_{v,1,0}) 设为 (inf),否则将 (f_{v,0,1}) 设为 (inf)。然后照常 (DP) 即可。最终单次操作复杂度为 (mathcal O(n)),总复杂度为 (mathcal O(nlog n))

Code

#include<bits/stdc++.h>
using namespace std;
const int N=3e5+10;
typedef long long ll;
namespace iobuff{
	const int LEN=1000000;
	char in[LEN+5],out[LEN+5];
	char *pin=in,*pout=out,*ed=in,*eout=out+LEN;
	inline char gc(void){
		return pin==ed&&(ed=(pin=in)+fread(in,1,LEN,stdin),ed==in)?EOF:*pin++;
	}
	inline void pc(char c){
		pout==eout&&(fwrite(out,1,LEN,stdout),pout=out);
		(*pout++)=c;
	}
	inline void flush(){fwrite(out,1,pout-out,stdout),pout=out;}
	template<typename T> inline void read(T &x){
		static int f;
		static char c;
		c=gc(),f=1,x=0;
		while(c<'0'||c>'9') f=(c=='-'?-1:1),c=gc();
		while(c>='0'&&c<='9') x=10*x+c-'0',c=gc();
		x*=f;
	}
	template<typename T> inline void putint(T x,char div){
		static char s[15];
		static int top;
		top=0;
		x<0?pc('-'),x=-x:0;
		while(x) s[top++]=x%10,x/=10;
		!top?pc('0'),0:0;
		while(top--) pc(s[top]+'0');
		pc(div);
	}
}
using namespace iobuff;

const ll inf=4e18;
int n,m,k,pd[N],v[N],mx,f[N],w[N],first[N],cnt=1;
struct node{
	int v,nxt;
}e[N<<1];
inline void add(int u,int v){e[++cnt].v=v;e[cnt].nxt=first[u];first[u]=cnt;}
char s[10];bool col[N],vis[N];
int rt,q[N],st[N],fr[N];
ll g[N][2][2];
inline ll calc(int i,int x){return 1ll*w[i]*(k==1?abs(x-v[i]):1ll*(x-v[i])*(x-v[i]));}

inline void dfs(int u,int f){
	vis[u]=1;bool fl=0,tmp=0;fr[u]=f;
	for(int i=first[u];i;i=e[i].nxt){
		int v=e[i].v;
		if((i^(f^1))&&pd[v]){
			if(!vis[v]){
				dfs(v,i);
				int x=~i&1;
				for(int t=0;t<2;++t){
					g[u][t][x]=min(g[u][t][x]+g[v][t][x],inf);
					g[u][t][x^1]=min(g[u][t][x^1]+min(g[v][t][0],g[v][t][1]),inf);
				}
			}
			else if(!rt) fl=1,rt=v,tmp=(~i&1);
		}
	}
	if(fl) g[u][tmp^1][tmp]=inf;
	if(u==rt) g[u][0][1]=g[u][1][0]=inf;
}
inline void cover(int u,bool x,bool y){
	col[u]=y;
	for(int i=first[u];i;i=e[i].nxt){
		int v=e[i].v;
		if((i^fr[v])||!pd[v]) continue;
		int t=~i&1;
		if(y==t) cover(v,x,y);
		else cover(v,x,g[v][x][0]<g[v][x][1]?0:1);
	}
}
inline void solve(int ql,int qr,int l,int r){
	if(l==r){
		for(int i=ql;i<=qr;++i) f[q[i]]=l;
		return ; 
	}
	if(ql>qr) return ;
	int mid=(l+r)>>1;
	for(int i=ql;i<=qr;++i){
		pd[q[i]]=1;
		g[q[i]][0][0]=g[q[i]][1][0]=calc(q[i],mid);
		g[q[i]][0][1]=g[q[i]][1][1]=calc(q[i],mid+1);
	}
	rt=0;
	for(int i=ql;i<=qr;++i){
		int u=q[i];
		if(!vis[u]){
			dfs(u,0);
			int x=0,y=0;
			for(int j=0;j<2;++j)for(int k=0;k<2;++k)if(g[u][j][k]<g[u][x][y]) x=j,y=k;
			cover(u,x,y);
		}
	}
	int L=ql,R=qr;
	for(int i=ql;i<=qr;++i){
		int u=q[i];
		if(!col[u]) st[L++]=u;
		else st[R--]=u;
		pd[u]=0;vis[u]=0;
	}
	for(int i=ql;i<=qr;++i) q[i]=st[i];
	solve(ql,L-1,l,mid);solve(L,qr,mid+1,r);
}
int main(){
	read(n);read(m);k=1;
	for(int i=1;i<=n;++i) read(v[i]),mx=max(mx,v[i]);
	for(int i=1;i<=n;++i) read(w[i]);
	for(int i=1,u,v;i<=m;++i){
		read(u);read(v);
		add(u,v);add(v,u);
	}
	for(int i=1;i<=n;++i) q[i]=i;
	solve(1,n,0,mx);
	ll ans=0;
	for(int i=1;i<=n;++i) ans+=calc(i,f[i]);
	printf("%lld
",ans);
	return 0;
}
原文地址:https://www.cnblogs.com/tqxboomzero/p/14887199.html