BZOJ1966: [Ahoi2005]VIRUS 病毒检测

BZOJ1966: [Ahoi2005]VIRUS 病毒检测

Description

科学家们在Samuel星球上的探险仍在继续。

非常幸运的,在Samuel星球的南极附近,探险机器人发现了一个巨大的冰湖!

机器人在这个冰湖中搜集到了许多RNA片段运回了实验基地。

科学家们经过几个昼夜的研究,发现这些RNA片段中有许多是未知的病毒!

每个RNA片段都是由A、C、T、G组成的序列。

科学家们也总结出了Samuel星球上的“病毒模版片段”。

一个模版片段是由A、C、T、G的序列加上通配符 * 和 ? 来表示。

其中 * 的意思是可以匹配上0个或任意多个字符,而 ? 的意思是匹配上任意一个字母。

如果一个RNA片段能够和“病毒模版片段”相匹配,那么这个RNA片段就是未知的病毒。

例如,假设“病毒模版片段”为A*G?C。RNA片段:AGTC,AGTGTC都是未知的病毒,而RNA片段AGTGC则不是病毒。

由于,机器人搜集的这些RNA片段中除去病毒的其他部分都具有非常高的研究价值。

所以科学家们希望能够分辨出其中哪些RNA片段不是病毒,并将不是病毒的RNA片段运回宇宙空间站继续进行研究。

科学家将这项任务交给了小联。

现在请你为小联编写程序统计哪些RNA片段不是病毒。

Input

第一行有一个字符串,由A、C、T、G、*、? 组成。表示“病毒模版片段”。

“病毒模版片段”的长度不超过1000。

第二行有一个整数N(0<N<500),表示机器人搜集到的RNA片段的数目。

随后的N行,每一行有一个字符串,由A、C、T、G组成,表示一个RNA片段。

每个RNA片段的长度不超过500。

注意:“病毒模版片段”和RNA片段的长度都至少为1。

Output

只有一行输出,为整数M,即不是病毒的RNA片段的数目。

Sample Input

A*G?C
3
AGTC
AGTGTC
AGTGC

Sample Output

1

HINT

输入中的RNA片段AGTGC不是病毒。


题解Here!

本来以为是一道$AC$自动机的题。

然后一看数据范围这么小:$N<=500$。

好像连$Trie$都不用建,暴力跑个$O(n^3)dp$似乎就能过了?

然后是真的能过。。。

设$dp[i][j]$表示原串匹配到第$i$个字符,模式串匹配到第$j$个字符时是否可行。

直接暴力匹配就好了。。。

$BUT$!星号的部分要特殊处理:

设一个$f$数组,表示$i$位置的星号最早能匹配到的一个字符。

匹配时,如果按照普通方法匹配不上,特判一下病毒模板串的上一位是不是星号。

如果上一位是星号,且这个星号能匹配到的最早位置在$j$之前,那么说明$j$之前的字符都可以丢给星号,于是判定为匹配成功。

问号直接丢掉不管就好了。

细节好多。。。

还有,$RNA$不是只有$A,C,G,U$吗?哪里来的$T$?

我怕不是学了假的高中生物必修一。。。

出题人怕不是初中保送清华,然后连高中都没上。。。

附代码:

#include<iostream>
#include<algorithm>
#include<cstdio>
#include<cstring>
#define MAXN 1010
using namespace std;
int n,len,ans=0;
int f[MAXN];
char str[MAXN],ch[MAXN];
bool dp[MAXN][MAXN];
inline int read(){
	int date=0,w=1;char c=0;
	while(c<'0'||c>'9'){if(c=='-')w=-1;c=getchar();}
	while(c>='0'&&c<='9'){date=date*10+c-'0';c=getchar();}
	return date*w;
}
inline bool check(char x,char y){
    if(x==y||x=='?')return true;
    return false;
}
void solve(int l){
    memset(f,0x3f,sizeof(f));
    memset(dp,false,sizeof(dp));
    dp[0][0]=true;
    for(int i=1;i<=len;i++){
        if(str[i]=='*'){
            if(i==1)dp[1][0]=true;
            for(int j=1;j<=l;j++)
            if(dp[i-1][j]||dp[i][j-1]){
                dp[i][j]=true;
                f[i]=min(f[i],j);
            }
        }
        else{
            for(int j=1;j<=l;j++){
                if(!check(str[i],ch[j]))continue;
                if(dp[i-1][j-1])dp[i][j]=true;
                else if(i>1&&str[i-1]=='*'&&f[i-1]<j)dp[i][j]=true;
            }
        }
    }
    if(dp[len][l])ans++;
}
void work(){
    for(int i=1;i<=n;i++){
        scanf("%s",ch+2);
        ch[1]='#';
        int l=strlen(ch+1);
        ch[++l]='#';
        solve(l);
    }
    printf("%d
",n-ans);
}
void init(){
    scanf("%s",str+2);
    n=read();
    str[1]='#';
    len=strlen(str+1);
    str[++len]='#';
}
int main(){
    init();
    work();
    return 0;
}
原文地址:https://www.cnblogs.com/Yangrui-Blog/p/9428535.html