一般来说概率正着推,期望逆着推。有环的一般要用到高斯消元解方程。
概率DP找到正确的状态定义后,转移是比较容易想到的。但状态一定是“可数”的,把有范围的整数作为数组下标。事实上,将问题直接作为状态是最好的。如问“n人做XX事的期望次数”,则设计状态为f[i]表示i个人做完事的期望。转移一般是递推,即从上一个状态转移得(填表)或转移向下一个状态(刷表)。
初始状态确定时可用顺推,终止状态确定时可用逆推。
例题:
涂格子1
n个格子,每次随机涂一个,求涂满m个格子的期望次数。
如概述所说,因为最终状态确定,使用逆推。设计状态$f[i]$表示涂了$i$个格子,到涂满$m$个格子还要涂的期望次数。初始状态是$f[m]=0$。转移时考虑$f[i]$是怎么来的,有$\frac{i}{n}$的概率由“涂到涂过的格子”转移来,即由$f[i]$转移来;另有$\frac{n-i}{n}$的概率由“涂到没涂过的格子”转移来,即由$f[i+1]$来。并且无论从哪里来,这次的期望次数都比原来的期望次数多$1$。于是转移方程为$f[i]=\frac{i}{n}f[i]+\frac{n-i}{n}f[i+1]+1(i<m)$。
涂格子2
n个格子,每次随机涂一个,求涂m次后期望涂色格子数。
如概述所说,设计状态f[i]表示涂i次后的答案。转移时考虑这次是涂了的还是没涂的。转移方程为$f[i]=\frac{n-f[i-1]}{n}+f[i-1]$。
另外,可证明$f[n]=n\cdot(1-(\frac{n-1}{n})^m)$。
涂格子3
有$n$个格子,每次会涂一个格子,其中涂第$i$个格子的概率是$p_i$(保证$\sum p_i$=1)。求每个格子都被涂色的期望次数。
因为涂到每个格子的概率不同,所以没法把“格子数量”当成一维状态,只能使用状压。设$f[S]$表示涂格子的状态(二进制表示)为$S$时到涂满还需要的次数。则初始状态为$f[2^n-1]=0$,转移时枚举涂哪个格子即可,具体方程为$f[S]=\sum_{i=0}^{n-1}p_if[S\text{ or }2^i]+1$。
小孩和礼物
有$n$个礼物盒和$m$个小孩,每个盒子里有一个礼物。所有人轮流开盒子,每次打开一个随机盒子,如果里面有礼物就拿走(如果被开过了就没有礼物了)。问所有人拿走礼物的期望数量。
一个礼物=一个打开过的盒子。f[i]表示i个人拿走礼物的期望,相当于表示涂i次期望涂色格子数量。同涂格子2。
麻球繁衍
开始有n个麻球,每天每个麻球会死亡,同时繁衍出若干新麻球。每个麻球繁衍i个麻球的概率是$p[i]$。求在m天内麻球死绝的概率。
每个麻球是互相独立的,设计状态f[i]表示一个麻球i天内死绝的概率,则n个麻球在i天内死亡的概率是$f[i]^n$。转移时考虑这个麻球第一天繁衍多少个,它们在接下来的$i-1$天内死绝了。转移方程为$f[i]=\sum_{j=0}^{k-1}p[j]f[i-1]^j$。
BZOJ4318 OSU!
开始有一个空串,每次添加一个0或1,添加1的概率为$p$。添加完后计算得分,每一段连续极长1段贡献$len^3$分。求最后期望得分。
转移时考虑是否增加1,如果增加了一个1,设当前期望连续1个数为$l$,那么答案应该增加$(l+1)^3-l^3$。因此还需要维护$l$和$l^2$的期望。维护$l^2$时同样考虑答案增加多少。
循环转移处理方法
有些DP方程之间会循环转移。可以高斯消元,或者设每个状态为形如$f[u]=a[u]f[fa]+b[u]f[0]+c[u]$,最后求出所有系数。
单人博弈
有三个正多面体骰子,第i个有k[i]面。每次扔全部三个骰子,得到等同于它们的和的分数。如果三个骰子分别掷得a、b、c,则得分清零。求得分≥n时的期望次数。
设f[i]表示得i分的期望次数。转移时考虑三个骰子的和,先算出p[i]表示和为i的概率,p0表示得分清零的概率。用刷表法,转移方程为$f[i]=\sum_kp[k]f[i+k]+p_0*f[0]+1$。 我们看到,转移方程是与$f[0]$有关的。设$f[i]=a[i]f[0]+b[i]$,则可以解出$a[i]$和$b[i]$。