uva 10529 Dumb Bones（概率与期望，期望dp）带公式推导题解

令(dp[i])表示放置连续的(i)个骨牌所需要的期望步数，按照区间DP的思想，它是来自一个(l+1+r)的区间的，这里的(+1)就是最后放的那块，且(l+1+r=i)，下面来考虑转移。

首先，假设骨牌倒了之后不会碰倒两边的骨牌，则有转移：

[dp[i]=dp[l]+dp[r]+frac{1}{1-pl-pr} ]

最后一项是放置(+1)的骨牌所需要的次数，这里应用了“概率倒数为发生一次的期望”这个知识。

现在考虑会碰倒两边骨牌的情况，感性认知一下，这会使得期望步数增加，增加的就是要把碰到的骨牌复原的次数。

那么往左倒的次数为((frac{1}{1-pl-pr}-1)*frac{pl}{pl+pr}=frac{pl}{1-pl-pr})，(-1)是因为要除去最后一次摆成功的那一次，乘以(frac{pl}{pl+pr})是根据条件概率公式所得到的。那么向左倒使得期望增加的值就是(frac{pl}{1-pl-pr}dp[l])，也就是我们求出了向左倒的期望次数，每一次都需要我们重新摆(dp[l])，因此二者相乘。注意，一开始我算成了(frac{pl}{1-pl-pr}(dp[l]+1))，这是错误的，因为这个(+1)所代表的失败其实包含在了(frac{1}{1-pl-pr})里了。

类似的，向右倒的次数为(frac{pr}{1-pl-pr})，带来的期望增加为(frac{pr}{1-pl-pr}dp[r])。

综上，有：

[dp[i]=dp[l]+dp[r]+frac{1}{1-pl-pr}+frac{pr}{1-pl-pr}dp[r]+frac{pl}{1-pl-pr}dp[l]=frac{(1-pr)dp[l]+(1-pl)dp[r]+1}{1-pl-pr} ]

进行转移即可，注意枚举的范围不要错（很容易漏掉边界之一，我因为这个wa了两发）。

代码：

#include<bits/stdc++.h>
using namespace std;
#define rep(i,a,n) for(int i=a;i<=n;i++)
#define per(i,a,n) for(int i=n;i>=a;i--)
#define pb push_back
#define SZ(x) ((int)(x).size())
#define fastin ios::sync_with_stdio(0);cin.tie(0);cout.tie(0)
typedef long long ll;
typedef pair<int,int> pii;
typedef double db;
int n;
db pl,pr,dp[1010];
int main(){
	while(scanf("%d",&n)){
		if(!n)	break;
		scanf("%lf%lf",&pl,&pr);
		rep(i,1,n){
			dp[i]=1e15;
		}
		dp[0]=0;dp[1]=1/(1-pl-pr);
		rep(i,2,n){
			rep(l,0,i-1){
				int r=i-(l+1);
				dp[i]=min(dp[i],
					(1-pr)/(1-pl-pr)*dp[l]+(1-pl)/(1-pl-pr)*dp[r]+1/(1-pl-pr));
			}
		}
		printf("%.2f
",dp[n]);
	}
	return 0;
}