【洛谷P2536】[AHOI2005]病毒检测

传送门

题意

题目描述

科学家们在Samuel星球上的探险仍在继续。非常幸运的,在Samuel星球的南极附近,探险机器人发现了一个巨大的冰湖!机器人在这个冰湖中搜集到了许多RNA片段运回了实验基地。

科学家们经过几个昼夜的研究,发现这些RNA片段中有许多是未知的病毒!

每个RNA片段都是由A、C、T、G组成的序列。科学家们也总结出了Samuel星球上的“病毒模版片段”。一个模版片段是由A、C、T、G的序列加上通配符 * 和 ? 来表示。其中 * 的意思是可以匹配上0个或任意多个字符,而 ? 的意思是匹配上任意一个字母。

如果一个RNA片段能够和“病毒模版片段”相匹配,那么这个RNA片段就是未知的病毒。

例如,假设“病毒模版片段”为A*G?C。RNA片段:AGTC,AGTGTC都是未知的病毒,而RNA片段AGTGC则不是病毒。

由于,机器人搜集的这些RNA片段中除去病毒的其他部分都具有非常高的研究价值。所以科学家们希望能够分辨出其中哪些RNA片段不是病毒,并将不是病毒的RNA片段运回宇宙空间站继续进行研究。

科学家将这项任务交给了小联。现在请你为小联编写程序统计哪些RNA片段不是病毒。

输入格式

第一行有一个字符串,由A、C、T、G、*、? 组成。表示“病毒模版片段”。“病毒模版片段”的长度不超过1000。第二行有一个整数N(0<N<500),表示机器人搜集到的RNA片段的数目。随后的N行,每一行有一个字符串,由A、C、T、G组成,表示一个RNA片段。每个RNA片段的长度不超过500。注意:“病毒模版片段”和RNA片段的长度都至少为1。

输出格式

只有一行输出,为整数M,即不是病毒的RNA片段的数目。

输入输出样例

输入 #1
A*G?C
    3
AGTC
AGTGTC
AGTGC
输出 #1
1

说明/提示

输入中的RNA片段AGTGC不是病毒。

解析

  • 在trie树上dfs的方式需要注意
  • 复杂度我不太清楚,先挖坑
  • 注意tot从1开始(这不是trie基本的边界吗)
  • 注意trie对应的数组空间最大开(N*字典大小)
  • 注意记录end[p]
  • 注意记录siz数组进行剪枝,即当一个节点的子树没有答案不用继续走

代码

#include<bits/stdc++.h>
using namespace std;
const int INF = 0x3f3f3f3f,N = 505;
char RNA[6]={'A','C','T','G'};
char s[N],a[1005];
int n,trie[N*N][55],tot=1,cnt,end[N*N],siz[N*N];
int lena;
void insert()
{
    int len=strlen(s+1),p=1;
    siz[p]++;
    for(int i=1;i<=len;i++)
    {
        int ch=s[i]-'A';
        if(!trie[p][ch]) trie[p][ch]=++tot;
        p=trie[p][ch];
        siz[p]++;
    }
    end[p]++;
}
void dfs(int u,int stp)
{
    if(!siz[u]) return;
    if(stp==lena+1) 
    {
        cnt+=end[u];
        siz[u]-=end[u];
        end[u]=0;
        return;
    }
    if(cnt==n) return;
    //printf("stp=%d,u=%d
",stp,u);
    if(a[stp]!='*'&&a[stp]!='?')
    {
        int ch=a[stp]-'A';
        if(trie[u][ch])dfs(trie[u][ch],stp+1);
    }
    else if(a[stp]=='?')
    {
        for(int i=0;i<4;i++)
        {
            int ch=RNA[i]-'A';
            if(trie[u][ch]) dfs(trie[u][ch],stp+1);
        }
    }
    else
    {
        dfs(u,stp+1);
        for(int i=0;i<4;i++)
        {
            int ch=RNA[i]-'A';
            if(trie[u][ch]) dfs(trie[u][ch],stp);
        }
    }
    siz[u]=0;
    for(int i=0;i<4;i++)
    {
        int ch=RNA[i]-'A';
        siz[u]+=siz[trie[u][ch]];
    }
}
int main()
{    
    scanf("%s",a+1);
    scanf("%d",&n);
    for(int i=1;i<=n;i++)    
    {
        scanf("%s",s+1);
        insert(); 
    }
    lena=strlen(a+1);
    dfs(1,1);
    printf("%d",n-cnt);
    return 0;
}
原文地址:https://www.cnblogs.com/conprour/p/15100819.html