uva 10529 Dumb Bones(概率与期望,期望dp)带公式推导题解

(dp[i])表示放置连续的(i)个骨牌所需要的期望步数,按照区间DP的思想,它是来自一个(l+1+r)的区间的,这里的(+1)就是最后放的那块,且(l+1+r=i),下面来考虑转移。

首先,假设骨牌倒了之后不会碰倒两边的骨牌,则有转移:

[dp[i]=dp[l]+dp[r]+frac{1}{1-pl-pr} ]

最后一项是放置(+1)的骨牌所需要的次数,这里应用了“概率倒数为发生一次的期望”这个知识。

现在考虑会碰倒两边骨牌的情况,感性认知一下,这会使得期望步数增加,增加的就是要把碰到的骨牌复原的次数。

那么往左倒的次数为((frac{1}{1-pl-pr}-1)*frac{pl}{pl+pr}=frac{pl}{1-pl-pr})(-1)是因为要除去最后一次摆成功的那一次,乘以(frac{pl}{pl+pr})是根据条件概率公式所得到的。那么向左倒使得期望增加的值就是(frac{pl}{1-pl-pr}dp[l]),也就是我们求出了向左倒的期望次数,每一次都需要我们重新摆(dp[l]),因此二者相乘。注意,一开始我算成了(frac{pl}{1-pl-pr}(dp[l]+1)),这是错误的,因为这个(+1)所代表的失败其实包含在了(frac{1}{1-pl-pr})里了。

类似的,向右倒的次数为(frac{pr}{1-pl-pr}),带来的期望增加为(frac{pr}{1-pl-pr}dp[r])

综上,有:

[dp[i]=dp[l]+dp[r]+frac{1}{1-pl-pr}+frac{pr}{1-pl-pr}dp[r]+frac{pl}{1-pl-pr}dp[l]=frac{(1-pr)dp[l]+(1-pl)dp[r]+1}{1-pl-pr} ]

进行转移即可,注意枚举的范围不要错(很容易漏掉边界之一,我因为这个wa了两发)。

代码:

#include<bits/stdc++.h>
using namespace std;
#define rep(i,a,n) for(int i=a;i<=n;i++)
#define per(i,a,n) for(int i=n;i>=a;i--)
#define pb push_back
#define SZ(x) ((int)(x).size())
#define fastin ios::sync_with_stdio(0);cin.tie(0);cout.tie(0)
typedef long long ll;
typedef pair<int,int> pii;
typedef double db;
int n;
db pl,pr,dp[1010];
int main(){
	while(scanf("%d",&n)){
		if(!n)	break;
		scanf("%lf%lf",&pl,&pr);
		rep(i,1,n){
			dp[i]=1e15;
		}
		dp[0]=0;dp[1]=1/(1-pl-pr);
		rep(i,2,n){
			rep(l,0,i-1){
				int r=i-(l+1);
				dp[i]=min(dp[i],
					(1-pr)/(1-pl-pr)*dp[l]+(1-pl)/(1-pl-pr)*dp[r]+1/(1-pl-pr));
			}
		}
		printf("%.2f
",dp[n]);
	}
	return 0;
}
原文地址:https://www.cnblogs.com/fried-chicken/p/13362107.html