动态规划之四边形不等式优化

四边形不等式

设函数(w(x,y))是定义在(Z)上的函数,若对于任意(a,b,c,d in Z),其中(aleq b leq c leq d), 都有(w(a,d)+w(b,c)ge w(a,c)+w(b,d)),则称函数(w)满足四边形不等式

推论:

设函数(w(x,y))是定义在(Z)上的函数,若对于任意(a,b in Z),其中(a<b), 都有(w(a,b+1)+w(a+1,b) ge w(a,b)+w(a+1,b+1)),则函数(w)满足四边形不等式

证明:

对于(a<c),有:

[w(a,c+1)+w(a+1,c) ge w(a,c)+w(a+1,c+1) ]

对于(a+1<c),有:

[w(a+1,c+1)+w(a+2,c) ge w(a+1,c)+w(a+2,c+1) ]

两式相加,得:

[w(a,c+1)+w(a+1,c)+w(a+1,c+1)+w(a+2,c)ge w(a,c)+w(a+1,c+1)\ +w(a+1,c)+w(a+2,c+1) ]

整理得:

[w(a,c+1)+w(a+2,c)ge w(a,c)+w(a+2,c+1) ]

依此类推,对于任意(aleq b leq c),有:

[w(a,c+1)+w(b,c)ge w(a,c)+w(b,c+1) ]

(此处即用(b)来代替(a+2),因为(a+1 <c) ,所以(b leq c)

同理,对于任意(aleq b leq c leq d),有:

[w(a,d)+w(b,c)ge w(a,c)+w(b,d) ]

定理1

对于任意(a,b,c,d in Z),如果函数(w)满足四边形不等式,且(w(a,d)ge w(b,c)),则函数(f)也满足四边形不等式,其中(f)满足:

[f(x,y)=min(f(x,z)+f(z+1,y)+w(x,y)|xleq z <y) ]

(特别的,我们令(f(x,y)=w(x,y)=0)

证明:

(x+1=y)时,我们有:

[f(x,y+1)+f(x+1,y)=f(x,x+2)+f(x+1,x+1)=f(x,x+2) ]

(f(x,x+2))的最优决策是(x+1),则:

[f(x,x+2)=f(x,x+1)+f(x+2,x+2)+w(x,x+2)=w(x,x+1)+w(x,x+2) ]

显然

[w(x,x+1)+w(x,x+2)ge w(x,x+1)+w(x+1,x+2) ]

(f(x,x+2))的最优决策是(x),则:

[f(x,x+2)=f(x,x)+f(x+1,x+2)+w(x,x+2)=w(x+1,x+2)+w(x,x+2) ]

显然

[w(x+1,x+2)+w(x,x+2)ge w(x+1,x+2)+w(x,x+1) ]

[w(x,x+1)+w(x+1,x+2)=f(x,x+1)+f(x+1,x+2)=f(x,y)+f(x+1,y+1) ]

所以当(x+1=y) 时,我们得到:

[f(x,y+1)+f(x+1,y)ge f(x,y)+f(x+1,y+1) ]

即此时四边形不等式成立。

接下来,我们运用数学归纳法

假设当(y-x<k)时,四边形不等式成立。

我们现在考虑(y-x=k)的情况

(f(x,y+1))(a)为最优决策,(f(x+1,y))(b)为最优决策。

不妨设(x+1leq a leq b)

易得:

[f(x,y+1)+f(x+1,y)=f(x,a)+f(a+1,y+1)+w(x,y+1)\ +f(x+1,b)+f(b+1,y)+w(x+1,y) ]

对于(f(x,y))(f(x+1,y+1)),由于(a)(b)不一定是最优决策,所以我们有:

[f(x,y)+f(x+1,y+1)le f(x,a)+f(a+1,y)+w(x,y)\ +f(x+1,b)+f(b+1,y+1)+w(x+1,y+1) ]

因为(w)满足四边形不等式,所以:

[w(x,y+1)+w(x+1,y)ge w(x,y)+w(x+1,y+1) ]

根据归纳假设,我们有:

[f(a+1,y+1)+f(b+1,y)ge f(a+1,y)+f(b+1,y+1) ]

于是我们有:

[f(x,y+1)+f(x+1,y)ge f(x,y)+(x+1,y+1) ]

定理2:

对于任意(a,b,c,d in Z),如果函数(w)满足四边形不等式,且函数(f)满足:

[f(x,y)=min(f(x,z)+f(z+1,y)+w(x,y)|xleq z <y) ]

(特别的,我们令(f(x,y)=w(x,y)=0)

(P(x,y))为令(f(x,y))取到最小值的(k)值。如果函数(f)满足四边形不等式,那么对于任意(x)(y),我们有:

[P(x,y-1)leq P(x,y)leq P(x+1,y) ]

证明:

(p=P(i,j))

对于任意的(x< k leq p),由四边形不等式得:

[f(x,t)+f(x+1,k)ge f(x,k)+f(x+1,t) ]

移项得:

[f(x+1,k)-f(x+1,t)ge f(x,k)-f(x,t) ]

由于(p)为最优决策,所以我们有:

[f(x,k)+f(k+1,y)ge f(x,p)+f(p+1,y) ]

所以:

[egin{array}{lcr} (f(x+1,k)+f(k+1,y)+w(x+1,y))-(f(x+1,p)+f(p+1,y)+w(x+1,y))\ =(f(x+1,k)-f(x+1,p))+(f(k+1,y)-f(p+1,y)) \ ge (f(x,k)-f(x,p))+(f(k+1,y)-f(p+1,y)) \ =(f(x,k)+f(k+1,y))-(f(x,p)+f(p+1,y))\ ge 0 end{array} ]

这意味着,对于(f(x+1,y)) 的任意决策(kleq p)(p)都要比(k)更优(包括相等)

所以

[P(x+1,y)ge P(x,y) ]

同理可证

[P(x,y-1)leq P(x,y) ]

所以

[P(x,y-1)leq P(x,y) leq P(x+1,y)) ]

例题

1.[NOI1995]石子合并

现在有(n)堆石子(环状), 每次只能将相邻的两堆合并成一堆,每次的得分是两队石子之和,求最大得分和最小得分

显然,本题是区间dp。

(dp[i][j])表示(i)(j)之间合并石子的最小值(最大值同理),则我们可以很轻松地列出状态转移方程为:

[dp[i][j]=min(dp[i][j],dp[i][k]+dp[k+1][j]+d(i,j)|ileq k < j) ]

其中(d(i,j))表示(i)(j)之间石子的个数

当问题是最小值时,我们就可以用四边形不等式优化了。此时,对于(dp[i][j]),我们只需要在区间([P[i][j-1],P[i+1][j]])枚举(k)即可,时间复杂度为(O(n^2))

注意:最大值并不满足单调性,不能用四边形不等式优化,但此时最大值有一个性质:

使最大值最优的决策(P[i][j])要么是(i),要么是(j-1)

证明:

反证法。

假设最优决策(P[i][j]=p),且(i<p<j-1)

我们有两种情况:

情况一:(d(i,p)leq d(p+1,j))

我们可以令(t=P[i][p]),于是此时我们的方案便是:

({[i,i+1,i+2,...,t|t+1,t+2,...,p]p+1,p+2,...j})

得分(F_1=(dp[i][t]+dp[t+1][p]+d(i,p))+dp[p+1][j]+d(i,j))

此时我们可以构造一种方案:

({i+1,i+2,...,t[t+1,t+2,...,p|p+1,p+2,...j]})

得分(F_2=dp[i][t]+(dp[t+1][p]+dp[p+1][j]+d(t+1,j))+d(i,j))

因为(t<p),所以(d(i,p)leq d(p+1,j< d(t+1,j))

所以(F_1< F_2),即此时决策(p)并不是最优

情况二:(d(i,p)>d(p+1,j))

同样的,我们令(t=P[p+1][j]),此时我们的方案:

({i,i+1,i+2,...,p[p+1,p+2,...,t|t+1,t+2,...j]})

得分(F_1=dp[i][p]+(dp[p+1][t]+dp[t+1][j]+d(p+1,j))+d(i,j))

我们仍然可以构造一种方案:

({[i,i+1,i+2,...,p|p+1,p+2,...,t]t+1,t+2,...j})

得分(F_2=(dp[i][p]+dp[p+1][t]+d(i,t+1))+dp[t+1][j]+d(i,j))

因为(t+1>p),所以(d(i,t+1)>d(i,p)>d(p+1,j))

所以(F_1<F_2),即此时决策(p)仍然不是最优

这与假设矛盾,所以最优决策只可能是(i)或者$j-1 $

Code:

#include<bits/stdc++.h>
using namespace std;
const int maxn=1005;
int dp[maxn][maxn];
int dp2[maxn][maxn];
int n;
int a[maxn];
int sum[maxn];
int p[maxn][maxn];
int main(){
	scanf("%d",&n);
	for(int i=1;i<=n;i++) scanf("%d",&a[i]),a[i+n]=a[i];
	for(int i=1;i<=2*n;i++) sum[i]=sum[i-1]+a[i],p[i][i]=i;
	for(int i=n<<1;i>=1;i--)
		for(int j=i+1;j<=n<<1;j++){
			dp[i][j]=0x3f3f3f3f;
			dp2[i][j]=max(dp2[i][i]+dp2[i+1][j],dp2[i][j-1]+dp2[j][j])+sum[j]-sum[i-1];
			for(int k=p[i][j-1];k<=p[i+1][j];k++)
				if(dp[i][k]+dp[k+1][j]+sum[j]-sum[i-1]<dp[i][j]){
					dp[i][j]=dp[i][k]+dp[k+1][j]+sum[j]-sum[i-1];
					p[i][j]=k;
				}else if(dp[i][k]+dp[k+1][j]+sum[j]-sum[i-1]==dp[i][j])
					p[i][j]=max(p[i][j],k);
			
		}
	int ans=0x3f3f3f3f;
	int ans2=0;
	for(int i=1;i<=n;i++) ans=min(ans,dp[i][i+n-1]);
	for(int i=1;i<=n;i++) ans2=max(ans2,dp2[i][i+n-1]); 
	printf("%d
%d
",ans,ans2);
	return 0;
}

参考文献:
1.李煜东《算法竞赛进阶指南》
2.2001年国家集训队论文 毛子青《动态规划算法的优化技巧》

原文地址:https://www.cnblogs.com/ybwowen/p/11116654.html