coin

### Decsription

  数据范围:(n<=3000,m<=300),保证(forall i,sumlimits_{j}p_{ij}=1000)
  

Solution

  日常期望算不对。。

  首先比较明显的一点是,每种类型是独立的,我们可以分开来考虑

  先来想一个比较直接的dp

  用(a[i][j])表示第(i)个人最喜欢(j)的概率,记(f[c][i][j])表示前(i)个人里面恰好有(j)个人最喜爱类型(c),转移显然:

[f[c][i][j]=f[c][i-1][j]*(1-a[i][j])+f[c][i-1][j-1]*a[i][j] ]

  再考虑用(g[i][j])表示第(i)种钞票携带了(j)张,期望拿走的数量,那么有转移:

[egin{aligned} g[i][j]&=sumlimits_{k=0}^mmin(k,j)*f[i][n][k]\ &=sumlimits_{k=0}^j k*f[i][n][k]+sumlimits_{k=j+1}^mj*f[i][n][k]\ end{aligned} ]

  然后我们就可以用一个背包求出答案了,但是这样无论是空间还是时间都很爆炸

  

​  考虑( abla g[i][j]=g[i][j]-g[i][j-1]),也就是( abla g[i][j]=sumlimits_{k=j}^m f[i][n][k]),首先注意到(f[i][n][k])(i)确定的情况下大小一定是随着(k)的增大而增大的,然后再看回这个( abla g[i][j]),显然这个东西的值应该是非负的,并且当(i)一定,( abla g[i][j])的值随着(j)的增大而单调不升

​  所以我们可以得到一个结论,当(i)确定的时候,(g[i][j])是不降的,并且增幅逐渐下降

​   

  然后又因为每种钞票是独立的,我们可以考虑一个贪心

  枚举(n)张钞票的每一张都选什么,对于每一种钞票(c),我们维护一个隐性的(p_c)(说是“隐性”是因为在实现的时候你并不需要真的去维护这么一个东西),表示钞票(c)当前已经取了(p_c)张,那么从贪心的角度来看,我们当前枚举到的这张钞票,肯定希望新加入这张钞票之后,对应的(g[c])的增幅最大,所以就可以得到一个大致的流程:从(1)(n)枚举每一张钞票选什么,对于第(i)张钞票,(O(m))求得最大的(g)的增幅,加入答案,然后对于选择的这个种类(c),更新其(g)

​  现在的问题就是怎么维护增幅,为了方便下面只针对确定的(c)类钞票进行表述

  一开始的时候(p_c=0)(g[c][0])(g[c][1])的增幅是很好计算的,( abla g[c][1]=1-prodlimits_{i=1}^n(1-a[i][c])),但是( abla g[c][2])看起来就不能那么直接地进行计算了,所以我们还是看回这个式子:( abla g[i][j]=sumlimits_{k=j}^mf[i][n][k]=1-sumlimits_{k=0}^{j-1}f[i][n][k]),那所以我们只要对于第(c)种钞票维护(f[c][i][j])就好,然后维护一个(sum[c]=sumlimits_{k=0}^{p_c}f[c][n][k]),每次更新完(f[c])之后把(f[c][n][p_c])加到(sum[c])里面就好了

​  接下来就是空间怎么解决:对于(f[c][i][j])来说,我们是按照(j)进行dp的,显然(j)那维可以滚动掉,(f[c][][j])(f[c][][j+1])的更新是(O(n))的,然后我们就获得了一个(O(nm))的算法

  

  mark:(弱智操作)谁告诉你听算期望的时候可以钦定顺序的???

​  

Code

#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
const int N=3010,M=310;
double sum[N],f[2][M][N];
double a[N][M];
int now[M],pre[M];
int n,m;
double ans;
void dp(int x){
    swap(now[x],pre[x]);
    int Now=now[x],Pre=pre[x];
    f[Now][x][0]=0;
    for (int i=1;i<=n;++i)
        f[Now][x][i]=f[Now][x][i-1]*(1-a[i][x])+f[Pre][x][i-1]*a[i][x];
}
 
int main(){
#ifndef ONLINE_JUDGE
    freopen("a.in","r",stdin);
#endif
    int x;
    scanf("%d%d",&n,&m);
    for (int i=1;i<=n;++i)
        for (int j=1;j<=m;++j)
            scanf("%d",&x),a[i][j]=1.0*x/1000;
    for (int i=1;i<=m;++i){
        f[0][i][0]=1;
        for (int j=1;j<=n;++j)
            f[0][i][j]=f[0][i][j-1]*(1-a[j][i]);
        sum[i]=f[0][i][n];
    }
    for (int i=1;i<=m;++i) now[i]=0,pre[i]=1;
    int which;
    double mx;
    for (int j=1;j<=n;++j){
        mx=0; which=-1;
        for (int i=1;i<=m;++i)
            if (1-sum[i]>mx)
                which=i,mx=1-sum[i];
        ans+=mx;
        dp(which);
        sum[which]+=f[now[which]][which][n];
    }
    printf("%.10lf
",ans);
}
原文地址:https://www.cnblogs.com/yoyoball/p/10146379.html