【HDU 4870】Rating【DP】

题意:一个人注冊两个账号,初始rating都是0,他每次拿低分的那个号去打比赛,赢了加50分,输了扣100分。胜率为p,他会打到直到一个号有1000分为止,问比赛场次的期望。

题解:因为每次添加分数或者是降低分数都是50的倍数,因而我们能够压缩成每次赢了添加一分。输了降低2分。依据题意我们easy看出,每次分数的变化都是最小的分数进行变化的。

因而我们定义状态ans[i][j]表示从初状态到两个号的分数为i,j的期望。

我们能够知道两个号的分数的变化总是[i,i]->[i+1,i]->[i+1,i+1];每次仅仅有一个号的分数在进行变动,这样子就比較easy进行状态的转移。

定义dp[i]表示i分数到达i+1分数的期望,则状态转移方程例如以下:

                                                                          dp[i] = 1×p+(1-p)*(1+dp[i-2]+dp[i-1]+dp[i]);  ans[i+1][i] = ans[i][i]+dp[i], ans[i+1][i+1] = ans[i+1][i]+dp[i];

#include <cstdio>
double ans[21][21], dp[21];
int main() {
    double p;
    int i, j;
    while (~scanf("%lf", &p)) {
        dp[0] = 1/p, dp[1] = 1+(1-p)/p*(dp[0]+1);
        for (i = 2;i <= 19;i++) dp[i] = 1+(1-p)/p*(dp[i-2]+dp[i-1]+1);
        ans[0][0] = 0,ans[1][0] = dp[0],ans[1][1] = ans[1][0]+dp[0];
        for (i = 1;i <= 19;i++) {
            ans[i+1][i] = ans[i][i]+dp[i];
            ans[i+1][i+1] = ans[i+1][i]+dp[i];
        }
        printf("%.6lf
", ans[20][19]);
    }
}


原文地址:https://www.cnblogs.com/claireyuancy/p/6875180.html