DP入门（3）——多阶段决策问题

　　多阶段决策问题，简单地说，每做一次决策就可以得到解的一部分，当所有决策做完之后，完整的解就“浮出水面”了。在回溯法中，每次决策对应于给一个结点产生新的子树，而解的生成过程对应一棵解答树，结点的层数就是“下一个待填充位置”cur。

一、多段图的最短路

　　多段图是一种特殊的DAG，其结点可以划分成若干个阶段，每个阶段只由上一个阶段所决定。

二、0-1背包问题

　　0-1背包问题是最广为人知的动态规划问题之一，拥有很多变形。在介绍0-1背包问题之前，先来看一个引例。

【物品无限的背包问题】

　　有n种物品，每种均有无穷多个。第 i 种物品的体积为Vi，重量为Wi。选一些物品装到一个容量为C的背包中，使得背包内物品在总体积不超过C的前提下重量尽量大。1<=n<=100,1<=Vi<=C<=10000,1<=Wi<=106。

　　分析：它很想上一篇中的硬币问题，只不过“面值之和恰好为S”改成了“体积之和不超过C”，另外增加了一个新的属性——重量，相当于把原来的无权图改成了带权图。这样，问题就变为了求以C为起点（终点任意）的、边权之和最大的路径。

　　与前面相比，DAG从“无权”变成了“带权”，但这并没有带来任何困难，此时只需将某处代码从“+1”变成“+W[i]”即可。

　　提示：动态规划的适用性很广。不少可以用动态规划解决的题目，在条件稍微变化后只需对状态转移方程做少量修改即可解决新问题。

【0-1背包问题】

　　有n种物品，每种只有一个。第i种物品的体积为Vi，重量为Wi。选一些物品装到一个容量为C的背包，使得背包内物品在总体积不超过C的前提下重量尽量大。1<=n<=100,1<=Vi<=C<=10000,1<=Wi<=106。

　　分析：刚才的方法已经不适用了：只凭“剩余体积”这个状态，无法得知每个物品是否已经用过。换句话说，原来的状态转移太乱了，任何时候都允许使用任何一种物品，难以控制。为了消除这种混乱，需要让状态转移（也就是决策）有序化。

　　引入“阶段”之后，算法便很容易设计了：用d（i , j）表示当前在第i层，背包剩余容量为j时接下来的最大重量和，则d（i , j）= max{d（i+1, j）, d（i+1, j-V[i]）+W[i]}，边界是i >n时d（i , j）= 0，j < 0时为负无穷（一般不会初始化这个边界，而是只当j>=V[i]时才计算第二项）。

　　通俗一点讲，d（i , j）表示“把第i,i+1,i+2,…,n个物品装到容量为j的背包中的最大总重量”。事实上，这个说法更加常用——”阶段“只是辅助思考的，在动态规划的状态描述中最好避免”结点“、”层“这样的术语。很多教材和资料直接给出了这样的状态描述，而本书中则是花费了大量的篇幅叙述为什么会想到要划分阶段以及和回溯法的内在联系——如果对此理解不够深入，很容易出现”每次碰到新题自己都想不出来，但一看题解就懂“的尴尬情况。

　　提示：学习动态规划的题解，除了要理解状态表示及其转移方程外，最好思考一下为什么会想到这样的状态表示。

　　和往常一样，在得到状态转移方程之后，还需思考如何编写程序。尽管在很多情况下，记忆化搜索程序更直观、易懂，但在0-1背包问题中，递推法更加理想。因为当有了“阶段”定义后，计算顺序变得非常明显。

　　提示：在多阶段决策问题中，阶段定义了天然的计算顺序。

　　下面是代码，答案是d[1][C]：

for(int i=n;i>=1;i--){
	for(int j=0;j<=C;j++){
		d[i][j] = (i==n ? 0 : d[i+1][j]);
		if(j >= V[i])	d[i][j] = max(d[i][j],d[i+1][j-V[i]]+W[i]);
	}
}

　　正如前面所说，i 必须逆序枚举，但 j 的循环次序是无关紧要的。