zoj 3329 概率dp

题意:有三个骰子,分别有k1,k2,k3个面。每个面值为1--kn
每次掷骰子,如果三个面分别为a,b,c则分数置0,否则加上三个骰子的分数之和。
当分数大于n时结束。求游戏的期望步数。初始分数为0

链接:点我
设dp[i]表示达到i分时到达目标状态的期望,pk为投掷k分的概率,p0为回到0的概率
则dp[i]=∑(pk*dp[i+k])+dp[0]*p0+1;
都和dp[0]有关系,而且dp[0]就是我们所求,为常数
设dp[i]=A[i]*dp[0]+B[i];
代入上述方程右边得到:
dp[i]=∑(pk*A[i+k]*dp[0]+pk*B[i+k])+dp[0]*p0+1
       =(∑(pk*A[i+k])+p0)dp[0]+∑(pk*B[i+k])+1;
明显A[i]=(∑(pk*A[i+k])+p0)
B[i]=∑(pk*B[i+k])+1
先递推求得A[0]和B[0].
那么  dp[0]=B[0]/(1-A[0]);

 1 #include<cstdio>
 2 #include<iostream>
 3 #include<algorithm>
 4 #include<cstring>
 5 #include<cmath>
 6 #include<queue>
 7 #include<map>
 8 using namespace std;
 9 #define MOD 1000000007
10 const int INF=0x3f3f3f3f;
11 const double eps=1e-5;
12 typedef long long ll;
13 #define cl(a) memset(a,0,sizeof(a))
14 #define ts printf("*****
");
15 const int MAXN=1005;
16 int n,m,tt;
17 double p[MAXN],A[MAXN],B[MAXN];
18 int main()
19 {
20     int i,j,k;
21     int k1,k2,k3,a,b,c;
22     #ifndef ONLINE_JUDGE
23     freopen("1.in","r",stdin);
24     #endif
25     scanf("%d",&tt);
26     while(tt--)
27     {
28         scanf("%d%d%d%d%d%d%d",&n,&k1,&k2,&k3,&a,&b,&c);
29         double p0=1.0/k1/k2/k3;
30         cl(p),cl(A),cl(B);
31         for(i=1;i<=k1;i++)
32             for(j=1;j<=k2;j++)
33                 for(k=1;k<=k3;k++)
34                 {
35                     if(i==a&&j==b&&k==c)    continue;
36                     p[i+j+k]+=p0;
37                 }
38         for(i=n;i>=0;i--)
39         {
40             A[i]=p0,B[i]=1;
41             for(j=1;j<=k1+k2+k3;j++)
42             {
43                 A[i]+=p[j]*A[i+j];
44                 B[i]+=p[j]*B[i+j];
45             }
46         }
47         printf("%.16lf
",B[0]/(1-A[0]));
48     }
49 }
原文地址:https://www.cnblogs.com/cnblogs321114287/p/4405024.html