[置顶] 白话01背包

前言：我想这些应该会让一个刚接触01背包的童鞋有收获！诚恳的希望有人指出我写的不清楚的地方。一起讨论。。

学习dp一周左右啦，关于01背包前前后后看了很多次，只是把一个模板死记下来，却完全不能理解，也看到很多前辈为了有助理解做的的一些表格，但是感觉还是迷糊，哎哎。。只怪自己脑子不够用....后面一次花了几个小时模拟了一次过程。这里作为一次详细的笔记，也作为一个分享：（前面的文字是比较繁琐，但是需要沉下心看，后面结合图表就容易理解也不那么烦人啦）

首先关于01背包问题：

有N个物品，每个物品（只有唯一一个） i 对应有重量w[i]、价值va[i]。有一个背包可以放M重的物品，现在让你从N个物品中选择几个物品(每单个物品要么选择，要么不选择)，在不超过背包上限情况使得背包装的价值最大。

分析：

如果你做过普通背包问题的话，可能第一个想到的就是贪心，按每件物品的价值比(价值/重量)从大到小排序，如果价值比一样就按价值从大到小排序，那样就可以每次选所有物品中价值比最大的，但是不幸的是这样的做法就错啦，用一个例子来说：有4件物品，背包最多放10kg，每件物品重量：1、4、6、8，价值1、4、6、8，（这里将价值和重量看成一样便于理解），他们的价值比都是1，但是为了贪到价值最大的，就按价值从大到小排序：8、6、4、1；然后先选择8，此时背包只能放2kg物品，你不得不选价值、重量为1的，那么你得到的价值之和为9，然而最优的确实中间两件物品：4、6，刚好不超过背包承受重量，价值为10大于那种贪心的做法！

-------------------------------------------------------------------------------------------------------------------------------------------------------

于是这里我们引进了01背包，动态规划，下面正式开讲：

首先，关于背包的计算有一个状态转移方程（自己开始老是理解不了），等会先给出，然后结合例子说，还有就是一个一维（叫做“滚动数组”）的数组还有一个二维的数组，这里先从二维的写起，个人觉得起步时理解二维的要容易！！

状态转移方程:dp[i][j]=max(dp[i-1][j],dp[i-1][j-w[i]]+va[i]); 那么先解释这个方程的意思，开始没懂不要紧，后面结合图表理解。。dp[i][j]表示：把第 i 件物品放入空间大小为 j 的背包的最大价值，w[i]表示第 i 件物品的重量，va[i] 表示第 i 件物品的价值；

下面给出这个二维数组的计算过程,(这也只是很多种其中的一种)：(开始没理解也不要紧)

for(i=1;i<=N;i++)  //N个物品、背包最大容量M、w[i]i的重量、va[i]i的价值
	for(j=M;j>=w[i];j++) //有的计算过程是 for(j=1;j<=M;j++) 都是一样的
	{
		if(dp[i-1][j]<dp[i-1][j-w[i]]+va[i])//这里就是dp[i][j]状态转移方程取最大的过程
			dp[i][j]=dp[i-1][j-w[i]]+va[i];
		else
			dp[i][j]=dp[i-1][j];
	}

下面模拟过程：

例子：4个物品、背包上限6
第一个：w[1]=1、va[1]=4

第二个：w[2]=2、va[2]=6

第三个：w[3]=3、va[3]=12

第四个：w[4]=2、va[4]=7

下面就是dp[i][j]数组的图表：并且初始化为0(这里并没有全部填写为0，实际上是全部填写为0啦)

此时（结合代码）是for循环的开始，第一个我们要填充的就是dp[1][6](图中黑色圈圈标记的格子)，也就是求：用第1个物品放入背包空间为6的最大值，按照上面的方程,这个最大值是从

dp[0][6]和dp[0][6-w[1]]+va[i]两个值中选出来:(看到这里大概明白为什么dp开始初始化要为0，并且两个for循环下标都是从1开始的)

那么选择之后便是：(最大值是dp[1][5]+4,也就是4)

接着继续填充下一个j=M之后的j--的格子，也就是dp[1][5]，依此填完这一列之后的结果：

之后就填写第二行的，并且注意，填写的格子的值由两根线指向中选择，但红色的那根线是 dp[2][6-w[2]]还要加上一个va[2]的值，然后和dp[1][6]比较，选择较大的值填入,那么这一行填完的结果便是:

这里也有一个地方要注意，我们有一个格子dp[2][1]没有填写，因为第二个for循环的结束条件就是j>=w[i]，解释为背包的容量大于等于 i 物品的重量才去放，不然你放都放不进就没有必要放啦。

那么等到最后，结果便是下面：

红色的就是没有填写过的，也就是初始化的值为0，只是在开始没有全部填写上0，最后，dp[4][6]的意思就是把4个物品都尝试放入背包上限为6kg的最大价值：即23.....那么01背包就是这么实现的。-------------------------------

小结：如果仔细看了上面的过程的话,那么多多少少应该有些理解过程了吧！那么总结一下，本次总结解决状态转移方程的含义，至于for循环的实现过程应该在模拟的过程都明白了吧

dp[i][j]=max(dp[i-1][j],dp[i-1][j-w[i]]+va[i]),用我们的那种 j 从M递减到 w[i]的方式，可以这样理解：最开始，背包里什么都没放，然后我们考虑背包容量为M到w[i]的情况（小于w[i]的意思就是背包装不下去，就没必要考虑），对于一个容量为 j 的背包A，考虑第 i 个物品，它当前有一个值dp[i][j]（最开始什么都没放都是0），然后我们就想如果我们找一个容量为 j-w[i]的背包B装第 i个物品，意思是装第 i 件物品使得背包B容量为 j （可以这样看：那个背包B原来容量dp[i-1][j-w[i]] ,现在放入 i 物品，容量变为dp[i-1][ j ] ），那么，对于B，它现在的价值就是原来价值dp[i-1][j-w[i]]加上刚装进的 i 的价值 va[i]，那么现在就做一个选择，是A的价值多还是B的价值多，我们就选择价值多的更新A，如果B大就为B，因为我们可以找到一个背包B，使得达到相同的背包容量 j 的时候价值更大。

——-------------------------------------------------------------------------理解了上面，那么下面就差不多啦...

那么，前面收到上面的那个计算过程代码只是一种，如果理解了上面的那种，那么下面的这种也就是一样的

for(i=1;i<=N;i++)
	for(j=1;j<=M;j++)//不同的地方是这里从1 到M
	{
		if(w[i]<=j) //这里因为背包从1到M，那么就要判断一下能否放入，放不进就把这个格子的值等于上面格子的值，也就是说这个物品放不进，只能放上面那件物品，价值也就上面的格子
		{
			if(dp[i-1][j]<dp[i-1][j-w[i]]+va[i])
				dp[i][j]=dp[i-1][j-w[i]]+va[i];
			else
				dp[i][j]=dp[i-1][j];
		}
		else
			dp[i][j]=dp[i-1][j];
	}

.....-----------------------------------------------

那么，如果比较清楚上面的实现过程啦...就可以初步了解用一维数组(既滚动数组)

仔细理解上面的过程，不难发现，我们每填写一行的时候，都是根据上一行的两个格子俩确定的...那么可以想象：我们用二维数组是不是浪费空间了呢？

那么先来看看一维的状态转移方程：dp[j]=max(dp[j],dp[j-w[i]]+va[i]);表示：把第i个物品放入背包容量为j的背包的最大价值,

实现过程代码:

for(i=1;i<=N;i++)//注意这里只是对空间进行优化，而两个for循环是一定的
	for(j=M;j>=w[i];j--)
		if(dp[j]<dp[j-w[i]]+va[i])
			dp[j]=dp[j-w[i]]+va[i];

那么现在也来模拟一下

还是上面的例子：4个物品、背包上限6
第一个：w[1]=1、va[1]=4

第二个：w[2]=2、va[2]=6

第三个：w[3]=3、va[3]=12

第四个：w[4]=2、va[4]=7

当进行第一行填写的时候，如下

填完第一个后之后的每次就用 dp[j]和dp[j-w[i]]+va[i]比较，选择大的更新dp[j],这样就可以节省很大的空间，

那么，值得注意的便是，用一维数组，j 只能从M到w[i] 递减，为什么呢？每次比较都是用本身dp[j]，和前面的dp[j-w[i]]比较，并且值更新dp[j]的值，那么，对于这一次的for循环，开始更新dp[j],随后j--，要填写和更新的dp[j]并没有受到刚刚的影响（这个容易懂吧......）但是一旦 j 像二维dp那样从1 到M递增，填写后面的数值很明显就被前面的影响啦。。。。。。。好吧至此，01背包总结完毕，为了方便理解，全部纯手工打造，比自己学习01背包的时间花的还长，不过希望对大家有帮助，也希望自己下次来看便可以很快了解.....如果有没说的清楚的地方可以指出讨论........转载谢谢合作指明出处...（如果有人愿意转载我这菜鸟的///////）

ps：最后给几个我最近做的01背包题目首先最最简单的裸题：poj3624、然后有一个poj3628，还有一个hdu1864，还有一个poj3211，个人认为这几个题目的顺序就是难度上升的梯度..这些题目也会在我的博客给出结题报告...