「Algospot」量化QUANTIZE

一道不难的DP题，主要是为了总结这类最优化题的思路；同时还学到了一个新操作

传送门：$>here<$

题意

给出一个长度为$N$的序列，要求最多使用s个数字进行量化（有损压缩），即代替原数字：使得量化后各个被代替的数与代替的数的差的平方之和最小。

数据范围：$n leq 100, s leq 10$

Solution

动态规划的常规思路

容易发现肯定选择数值相近的一些数字用一个数字取替代，所以肯定先排序。

排序完后就是一个简单的dp题了。$dp[i][j]$表示前$i$个数字，使用$j$个数字量化的最小误差。当前决策一定关于第$i$个数字有关，问题在于究竟这一段要多长。在枚举一个k，转移就很明显了：

$dp[i][j]=Min{dp[k][j-1]+quantize(k+1,i)}$

究竟用什么来做量化的值

问题转化为了如何求$quantize$函数。就这道题的范围来看，从最小到最大枚举也是没有问题的。但实际上有$O(1)$方法。

设我们选择$m$来量化，也就是说函数$y=sumlimits_{i=l}^{r}(m-a[i])^2$最小。问题转化为求此函数的最小值。

这是个二次函数，所以展开后直接求导（或直接使用顶点公式），找到顶点的$x$坐标即可。

$y=sumlimits_{i=l}^{r}(m-a[i])^2=(r-l+1)m^2-2msumlimits_{i=l}^{r}a[i]+sumlimits_{i=l}^{r}a[i]^2$

当$y'=2(r-l+1)m-2sumlimits_{i=l}^{r}a[i]=0$时

$m=frac{sumlimits_{i=l}^{r}a[i]}{r-l+1}$

这就是平均值！由此我们得到结论：当利用平均值来当量化值时，差的平方之和最小。

透过题解看本质

其实对于这类最优化dp问题，可以看做是递归问题。dp的本质是记忆化搜索，只不过可以利用递推来实现。当我搜到这一步时需要枚举来决策当前需要多长的一段来量化，而剩余的则不需要递归，而是直接利用之前做好的最优子结构。这就是dp为什么比dfs快了。其实dp就是暴力，它终究需要考虑所有需要且可能的情况。

my code

具体在实现的时候通过统计前缀和以及平方的前缀和来$O(1)$完成求解。注意把$m$代入求误差时也要利用前缀和。

注意平均值应该四舍五入。

/*By DennyQi 2018*/
#include <cstdio>
#include <queue>
#include <cstring>
#include <algorithm>
using namespace std;
typedef long long ll;
const int MAXN = 110;
const int MAXM = 20010;
const int INF = 0x3f3f3f3f;
inline int Max(const int a, const int b){ return (a > b) ? a : b; }
inline int Min(const int a, const int b){ return (a < b) ? a : b; }
inline int read(){
    int x = 0; int w = 1; register char c = getchar();
    for(; c ^ '-' && (c < '0' || c > '9'); c = getchar());
    if(c == '-') w = -1, c = getchar();
    for(; c >= '0' && c <= '9'; c = getchar()) x = (x<<3) + (x<<1) + c - '0'; return x * w;
}
int T,N,s;
int a[MAXN],dp[MAXN][12],sum[MAXN],ssqr[MAXN];
inline int calc(int l, int r, int m){
    int res = 0;
    res += m*m * (r-l+1);
    res += ssqr[r] - ssqr[l-1];
    res -= 2*m*(sum[r]-sum[l-1]);
    return res;
}
inline int quantize(int l, int r){
    int m = (sum[r]-sum[l-1]) / (r-l+1);
    return Min(calc(l,r,m), calc(l,r,m+1));
}
inline int Solve(){
    sort(a+1,a+N+1);
    sum[0] = ssqr[0] = 0;
    for(int i = 1; i <= N; ++i){
        sum[i] = sum[i-1] + a[i];
        ssqr[i] = ssqr[i-1] + a[i] * a[i];
    }
    memset(dp,INF,sizeof(dp));
    for(int i = 0; i <= s; ++i) dp[0][i] = 0;
    for(int i = 1; i <= N; ++i){
        for(int j = 1; j <= s; ++j){
            for(int k = 0; k < i; ++k){
                dp[i][j] = Min(dp[i][j], dp[k][j-1] + quantize(k+1,i));
            }
        }
    }
    return dp[N][s];
}
int main(){
//    freopen(".in","r",stdin);
    T = read();
    while(T--){
        N = read(), s = read();
        for(int i = 1; i <= N; ++i){
            a[i] = read();
        }
        printf("%d
", Solve());
    }
    return 0;
}