bzoj1030 [JSOI2007]文本生成器(AC+dp)

推=>http://blog.csdn.net/popoqqq/article/details/41802417

Description
JSOI交给队员ZYX一个任务,编制一个称之为“文本生成器”的电脑软件:该软件的使用者是一些低幼人群,他们现在使用的是GW文本生成器v6版。该软件可以随机生成一些文章―――总是生成一篇长度固定且完全随机的文章—— 也就是说,生成的文章中每个字节都是完全随机的。如果一篇文章中至少包含使用者们了解的一个单词,那么我们说这篇文章是可读的(我们称文章a包含单词b,当且仅当单词b是文章a的子串)。但是,即使按照这样的标准,使用者现在使用的GW文本生成器v6版所生成的文章也是几乎完全不可读的?。ZYX需要指出GW文本生成器 v6生成的所有文本中可读文本的数量,以便能够成功获得v7更新版。你能帮助他吗?

Input
  输入文件的第一行包含两个正整数,分别是使用者了解的单词总数N (<= 60),GW文本生成器 v6生成的文本固定长度M;以下N行,每一行包含一个使用者了解的单词。这里所有单词及文本的长度不会超过100,并且只可能包含英文大写字母A..Z

Output
  一个整数,表示可能的文章总数。只需要知道结果模10007的值。

Sample Input
2 2
A
B

Sample Output
100

分析:
AC自动机上的dp
计算有多少字符串不含有任何一个给出的字符串
考虑把所有给出串的AC自动机构建出来,
那么任何一个串的终止结点及其在fail树上的儿子是不能被访问的
记录f[i][j]表示考虑到了第i个字符,
当前在AC自动机上第j个结点的方案数,
转移只需依次枚举下一个字符,
然后到了AC自动机上第k个结点,
若第k个结点是可以被访问的,
则对f[i+1][k]贡献了f[i][j]

方程:
f[i+1][k]+=f[i][j] (k是j的儿子且!ed[j])

最后用总方案数减去不合法方案数,时间复杂度 O(nml)

tip

在构建fail指针的时候同时维护ed
这时的ed已经不是单纯的标记单词结尾了,
ed==1代表这个点不能到达,
ed[ch[r][i]]|=ed[fail[ch[r][i]]]; //儿子的ed | 儿子fail的ed
(1|1=1,1|0=1,0|0=0,如果儿子的fail不能到达,儿子也不能到达)

f[0][0]=0

循环AC自动机节点的时候从0开始

时刻判断ed

1stWA ed数组开小

2ndWA 读入模式串的时候循环写成1~m

这里写代码片
#include<cstdio>
#include<cstring>
#include<iostream>
#include<queue>

using namespace std;

const int mod=10007;
int n,m,tot=0;
int fail[6010],ch[6010][30],f[200][6010];
char w[105];
bool ed[6010];

int KSM(int a,int p)
{
    int t=1;
    while (p)
    {
        if (p&1)
           t=(t*a)%mod;
        a=(a*a)%mod;
        p>>=1;
    }
    return t%mod;
}

void build()
{
    int now=0;
    int len=strlen(w);
    for (int i=0;i<len;i++)
    {
        int x=w[i]-'A';
        if (!ch[now][x]) ch[now][x]=++tot;
        now=ch[now][x];
    }
    ed[now]=1;
}

void make()
{
    queue<int> q;
    for (int i=0;i<26;i++)
        if (ch[0][i])
            q.push(ch[0][i]);
    while (!q.empty())
    {
        int r=q.front();
        q.pop();
        for (int i=0;i<26;i++)
        {
            if (!ch[r][i])
            {
                ch[r][i]=ch[fail[r]][i];
                continue;
            }
            fail[ch[r][i]]=ch[fail[r]][i];
            ed[ch[r][i]]|=ed[fail[ch[r][i]]];  //儿子的ed  儿子fail的ed 
            q.push(ch[r][i]);
        }
    }
}

void doit()
{
    int ans;  
    int i,j,k;
    ans=KSM(26,m);  //总数 
    f[0][0]=1;  //
    for (i=0;i<m;i++)  //构造m长度的字符串 
        for (j=0;j<=tot;j++)  //AC自动机上的点
            if (!ed[j])  //不是结束字符 
                for (k=0;k<26;k++)  //枚举下一个点
                {
                    int x=ch[j][k];  //节点编号
                    if (ed[x]) continue;
                    f[i+1][x]+=f[i][j];
                    f[i+1][x]%=mod; 
                } 
    for (i=0;i<=tot;i++) 
        if (!ed[i])  //
           ans+=mod-f[m][i],ans%=mod;
    printf("%d",ans);  
    return;
}

int main()
{
    memset(ed,0,sizeof(ed));
    scanf("%d%d",&n,&m);
    for (int i=1;i<=n;i++) 
    {
        scanf("%s",&w);
        build();
    }
    make();
    doit();
    return 0;
}
原文地址:https://www.cnblogs.com/wutongtong3117/p/7673483.html