P2292 [HNOI2004]L语言

题目描述

标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。

一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。

例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的,因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解,而且是在字典D下能够被理解的最长的前缀。

给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。并给出其在字典D下能够被理解的最长前缀的位置。

输入输出格式

输入格式:

输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。之后的n行每行描述一个单词,再之后的m行每行描述一段文章。

其中1<=n, m<=20,每个单词长度不超过10,每段文章长度不超过1M。

输出格式:

对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。

输入输出样例

输入样例#1: 
4 3 
is
name
what
your
whatisyourname
whatisyouname
whaisyourname
输出样例#1: 
14  (整段文章’whatisyourname’都能被理解)
6  (前缀’whatis’能够被理解)
0  (没有任何前缀能够被理解)

Solution:

  AC自动机板子题,但是可以用trie树+简单dp水过去。

  我们将字典中的单词构建一棵trie,每次查询时,标记能被识别的前缀位置,然后每次扫到被标记的位置就从trie头指针重新来一次扫描,然后对于每个扫到的单词的结尾,更新一下最远能到达的前缀位置就好了。

代码:

#include<bits/stdc++.h>
#define il inline
#define ll long long
#define For(i,a,b) for(int (i)=(a);(i)<=(b);(i)++)
#define Bor(i,a,b) for(int (i)=(b);(i)>=(a);(i)--)
using namespace std;
const int N=1000005;
int n,m,end[N],trie[N][26],tot=1,f[N];
char s[N];

il void insert(char *s){
    int len=strlen(s),p=1;
    For(k,0,len-1){
        int ch=s[k]-'a';
        if(!trie[p][ch]) trie[p][ch]=++tot;
        p=trie[p][ch];
    }
    end[p]=1;
}

il int search(char *s,int v){
    int p=1,ans=0,len=strlen(s+1);
    f[0]=v;
    For(i,0,len){
        if(f[i]!=v)continue;
        p=1;
        For(j,i+1,len){
            if(!trie[p][s[j]-'a'])break;
            p=trie[p][s[j]-'a'];
            if(end[p])ans=max(ans,j),f[j]=v;
        }
    }
    return ans;
}

int main(){
    scanf("%d%d",&n,&m);
    For(i,1,n) scanf("%s",s),insert(s);
    For(i,1,m) scanf("%s",s+1),printf("%d
",search(s,i));
    return 0;
}
原文地址:https://www.cnblogs.com/five20/p/9434973.html