动态规划之背包问题

动态规划的基本思想：

将一个问题分解为子问题递归求解，且将中间结果保存以避免重复计算。通常用来求最优解，且最优解的局部也是最优的。求解过程产生多个决策序列，下一步总是依赖上一步的结果，自底向上的求解。

动态规划算法可分解成从先到后的4个步骤：

1. 描述一个最优解的结构，寻找子问题，对问题进行划分。

2. 定义状态。往往将和子问题相关的各个变量的一组取值定义为一个状态。某个状态的值就是这个子问题的解（若有k个变量，一般用K维的数组存储各个状态下的解，并可根据这个数组记录打印求解过程。）。

3. 找出状态转移方程。一般是从一个状态到另一个状态时变量值改变。

4. 以“自底向上”的方式计算最优解的值。

5. 从已计算的信息中构建出最优解的路径。(最优解是问题达到最优值的一组解)

其中步骤1~4是动态规划求解问题的基础，如果题目只要求最优解的值，则步骤5可以省略。

背包问题

01背包: 有N件物品和一个重量为M的背包。（每种物品均只有一件）第i件物品的重量是w[i]，价值是p[i]。求解将哪些物品装入背包可使价值总和最大。

完全背包: 有N种物品和一个重量为M的背包，每种物品都有无限件可用。第i种物品的重量是w[i]，价值是p[i]。求解将哪些物品装入背包可使这些物品的重量总和不超过背包重量，且价值总和最大。

多重背包: 有N种物品和一个重量为M的背包。第i种物品最多有n[i]件可用，每件重量是w[i]，价值是p[i]。求解将哪些物品装入背包可使这些物品的总量总和不超过背包重量，且价值总和最大。

01背包问题：

这是最基础的背包问题，特点是：每种物品仅有一件，可以选择放或不放。

用子问题定义状态：即c[i][m]表示前i件物品恰放入一个重量为m的背包可以获得的最大价值。则其状态转移方程便是：

c[i][m]=max{c[i-1][m],c[i-1][m-w[i]]+p[i]}

这个方程非常重要，基本上所有跟背包相关的问题的方程都是由它衍生出来的。所以有必要将它详细解释一下：“将前i件物品放入重量为m的背包中”这个子问题，若只考虑第i件物品的策略（放或不放），那么就可以转化为一个只牵扯前i-1件物品的问题。如果不放第i件物品，那么问题就转化为“前i-1件物品放入容量为m的背包中”，价值为c[i-1][m]；如果放第i件物品，那么问题就转化为“前i-1件物品放入剩下的重量为m-w[i]的背包中”，此时能获得的最大价值就是c[i-1][m-w[i]]再加上通过放入第i件物品获得的价值p[i]。

测试数据：

10,3

3,4

4,5

5,6

c[i][j]数组保存了1,2,3号物品依次选择后的最大价值.

这个最大价值是怎么得来的呢?从背包容量为0开始,1号物品先试,0,1,2,的容量都不能放.所以置0,背包容量为3则里面放4.这样,这一排背包容量为4,5,6,....10的时候，最佳方案都是放4.假如1号物品放入背包.则再看2号物品.当背包容量为3的时候，最佳方案还是上一排的最价方案c为4.而背包容量为4的时候，则最佳方案为自己的重量5.背包容量为7的时候，很显然是5加上一个值了。加谁??很显然是7-4=3的时候.上一排c3的最佳方案是4.所以。总的最佳方案是5+4为9.这样.一排一排推下去。最右下放的数据就是最大的价值了。(注意第3排的背包容量为7的时候,最佳方案不是本身的6.而是上一排的9.说明这时候3号物品没有被选.选的是1,2号物品.所以得9.)

#include <iostream>

using namespace std;

const int MAXN = 100;
const int MAXM = 1000;

/**
 * 01背包
 * @param n 物品个数
 * @param m 背包承重量
 * @param p[] 物品价值
 * @param w[] 物品重量
 * @return 最大价值
 */
int knapsack01(int n, int m, int p[], int w[])
{
    int c[MAXN][MAXM];
    for(int i=1; i<=n; ++i)
    {
        c[i][0] = 0;
    }

    for(int i=1; i<=m; ++i)
    {
        c[0][i] = 0;
    }

    for(int i=1; i<=n; ++i)
    {
        for(int j=1; j<=m; ++j)
        {

            if((w[i]<=j) && (c[i-1][j] < c[i-1][j-w[i]]+p[i]))
            {
                c[i][j] = c[i-1][j-w[i]]+p[i];
            }
            else
            {
                c[i][j] = c[i-1][j];
            }
        }
    }

    return c[n][m];
}





int main(int argc, char** argv)
{

    int p[MAXN];
    int w[MAXM];
    p[1] = 4;
    p[2] = 5;
    p[3] = 6;
    w[1] = 3;
    w[2] = 4;
    w[3] = 5;

    cout << knapsack01(3,10,p,w) <<endl;



    return 0;
}

这里是用二位数组存储的，可以把空间优化，用一位数组存储。

用f[0..m]表示，f[m]表示把前i件物品放入容量为m的背包里得到的价值。把i从1~n(n件)循环后，最后f[m]表示所求最大值。

*这里f[m]就相当于二位数组的c[i][m]。那么，如何得到c[i-1][m]和c[i-1][m-w[i]]+p[i]？

首先要知道，我们是通过i从1到n的循环来依次表示前i件物品存入的状态，即：for i=1..N。现在思考如何能使f[m]表示当前状态是容量为m的背包所得价值，而又使f[m]和f[m-w[i]]+p[i]表示前一状态的价值？

逆序！

for i=1..N

   for m=M..0

        f[m]=max{f[m],f[m-w[i]]+p[i]};

这里为什么要逆序呢？想想max中比较的两部分，对于f[m],当前i情况下的f[m]值还没有求出来，所以f[m]中存储的必然是i-1情况下的值，即为原来的c[i-1][m]；但是f[m-w[i]]就不同了，如果是正序，当前i情况下，在求f[m]之前，很可能f[m-w[i]]已经计算出值了，所以为了保证f[m-w[i]] = c[i-1][m-w[i]]，需要逆序，确保当前i的情况下，比m小的值还没有计算出来。

完全背包

这个问题非常类似于01背包问题，所不同的是每种物品有无限件，也就是从每种物品的角度考虑，与它相关的策略已并非取或不取两种，而是有取0件、取1件、取2件……取M/w[i]件等很多种。如果仍然按照解01背包时的思路，令c[i][m]表示前i种物品放入一个容量为m的背包的最大价值。仍然可以按照每种物品不同的策略写出状态转移方程，像这样：

c[i][m]=max{c[i-1][m],c[i-1][m-k*w[i]]+k*p[i]}（0<=k*w[i]<=m）

这跟01背包问题一样有O(N*M)个状态需要求解，但求解每个状态c[i][m]的时间是O(m/w[i])，总的复杂度是超过O(NM)的。

时间复杂度优化为O(NM) （精华）

将原始算法的思想转变一下。

设c[i][m]表示在前i种物品中选取若干件物品放入容量为m的背包所得的最大价值。那么对于第i种物品的出现，我们对第i种物品放不放入背包进行决策。如果不放那么c[i][m]=c[i-1][m]；如果确定放，背包中应该出现至少一件第i种物品，所以c[i][m]中至少应该出现一件第i种物品,即c[i][m]=c[i][m-w[i]]+p[i]。为什么会是c[i][m-w[i]]+p[i]？ p[i]是当前选择放i这种物品以后获得的价值，既然选择了放一次i，那么对应的重量就要减去w[i],对于剩下的重量m-w[i]，由于是完全背包，我们仍然有i种物品可放，c[i][m-w[i]]即表示在重量为m-w[i]的情况下，i种物品能获得的最大值。这个最大值加上p[i]的结果正是我们要来跟c[i-1][m]比较的。

状态方程为：

思想改变后，就省去了对于不同的k值情况的循环。但是为什么结果就能跟上面的老公式一样呢？还是会存有疑惑。

让我们来再详细分析一下，旧的公式，对于第i种物品，我们需要比较c[i-1][m]，c[i-1][m-w[i]]+p[i]，c[i-1][m-2*w[i]]+2*p[i]，c[i-1][m-3*w[i]]+3*p[i] ....等等的最大值，新的公式c[i-1][m]不变，那就来看为什么c[i][m-w[i]]+p[i] 可以表示c[i-1][m-w[i]]+p[i]，c[i-1][m-2*w[i]]+2*p[i]，c[i-1][m-3*w[i]]+3*p[i] ....等等的最大值？

从新公式，我们知道c[i][m-w[i]]来源于max{c[i-1][m-w[i]], c[i][m-w[i]-w[i]] + p[i]}，而同样考虑下去，c[i][m-w[i]-w[i]] 呢？c[i][m-w[i]-w[i]] 又来源于max{c[i-1][m-w[i]-w[i]], c[i][m-w[i]-w[i]-w[i]] + p[i]}.

聪明的童鞋应该可以发现了吧。

c[i][m-w[i]]+p[i]

= max{ c[i-1][m-w[i]], c[i][m-w[i]-w[i]] + p[i] }+p[i]

= max{ c[i-1][m-w[i]]+p[i], c[i][m-w[i]-w[i]] + p[i]+p[i] }

= max{ c[i-1][m-w[i]]+p[i], max{ c[i-1][m-w[i]-w[i]], c[i][m-w[i]-w[i]-w[i]] + p[i] } + p[i]+p[i] }

= max{ c[i-1][m-w[i]]+p[i], max{ c[i-1][m-w[i]-w[i]]+ p[i]+p[i], c[i][m-w[i]-w[i]-w[i]] + p[i]+ p[i]+p[i] } }

= max{ c[i-1][m-w[i]]+p[i], max{ c[i-1][m-2*w[i]]+ 2*p[i], c[i][m-3*w[i]] + 3*p[i] } }

当然你还可以继续推导，但现在已经可以看出来了吧，c[i-1][m-w[i]]+p[i]，c[i-1][m-2*w[i]]+2*p[i]，c[i-1][m-3*w[i]]+3*p[i] ....这一系列状态在我们求解c[i][m-w[i]]+p[i]的时候都已经被比较过了，c[i][m-w[i]]+p[i]就是这些状态的最大值。

修改公式后的代码如下

#include <iostream>

using namespace std;

const int MAXN = 100;
const int MAXM = 1000;


/**
 * 完全背包
 * @param n 物品个数
 * @param m 背包承重量
 * @param p[] 物品价值
 * @param w[] 物品重量
 * @return 最大价值
 */
int entirelyKnapsack(int n, int m, int p[], int w[])
{
    int c[MAXN][MAXM];
    for(int i=1; i<=n; ++i)
    {
        c[i][0] = 0;
    }

    for(int i=1; i<=m; ++i)
    {
        c[0][i] = 0;
    }

    for(int i=1; i<=n; ++i)
    {
        for(int j=1; j<=m; ++j)
        {

            if(w[i]<=j)
            {
                
                if(c[i-1][j] <  c[i][j-w[i]]+p[i])
                {
                    c[i][j] = c[i][j-w[i]]+p[i];
                }
                else
                {
                    c[i][j] = c[i-1][j];
                }

            }
            else
            {
                c[i][j] = c[i-1][j];
            }
        }
    }

    return c[n][m];
}


int main(int argc, char** argv)
{

    int p[MAXN];
    int w[MAXM];
    p[1] = 4;
    p[2] = 5;
    p[3] = 6;
    w[1] = 3;
    w[2] = 4;
    w[3] = 5;

    //cout << knapsack01(3,10,p,w) <<endl;

    cout << entirelyKnapsack(3,10,p,w) <<endl;

    return 0;
}

最后我们再来讨论一下完全背包的一维数组优化

和01背包问题一样，完全背包也可以用一维数组f[0..m]来保存数据。算法样式和01背包的很相似，唯一不同的是对m遍历时变为正序，而01背包为逆序。

为什么又是正序了呢？？

比较一下01背包和完全背包的公式

01背包 c[i][m]=max{c[i-1][m],c[i-1][m-w[i]]+p[i]}

完全背包 c[i][m]=max{c[i-1][m],c[i][m-w[i]]+p[i]}

区别就在这里，01背包逆序是想用f[m-w[i]]+p[i] 表示 c[i-1][m-w[i]]+p[i]，确保在考虑f[m-w[i]]的时候，c[i][m-w[i]]还没有被计算出来存入f[m-w[i]]。而完全背包呢，f[m-w[i]]+p[i] 应该表示的就是 c[i][m-w[i]]+p[i],我们需要考虑重量减少但还可以放i这种物品的情况，所以使用了正序。

for i=1..N

   for m=0...M

        f[m]=max{f[m],f[m-w[i]]+p[i]};

其他

将01背包问题的基本思路加以改进，得到了这样一个清晰的方法。这说明01背包问题的状态转移方程可以推及其它类型的背包问题。但是由于复杂度太高，我们还是试图改进这个复杂度。

完全背包问题有一个很简单有效的优化，是这样的：若两件物品i、j满足p[i]<=p[j]且w[i]>=w[j]，则将物品i去掉，不用考虑。这个优化的正确性显然：任何情况下都可将重量大费用高得i换成物美价廉的j，得到至少不会更差的方案。对于随机生成的数据，这个方法往往会大大减少物品的件数，从而加快速度。然而这个并不能改善最坏情况的复杂度，因为有可能特别设计的数据可以一件物品也去不掉。这个优化可以简单的O(N^2)地实现，一般都可以承受。

另外，针对背包问题而言，比较不错的一种方法是：首先将费用大于M的物品去掉，然后使用类似计数排序的做法，计算出费用相同的物品中价值最高的是哪个，可以O(M+N)地完成这个优化。

既然01背包问题是最基本的背包问题，那么我们可以考虑把完全背包问题转化为01背包问题来解。最简单的想法是，考虑到第i种物品最多选M/w[i]件，于是可以把第i种物品转化为M/w[i]件价值为p[i]及重量为w[i]的物品，然后求解这个01背包问题。这样完全没有改进基本思路的时间复杂度，但这毕竟给了我们将完全背包问题转化为01背包问题的思路：将一种物品拆成多件物品。