BZOJ2434【NOI2011】阿狸的打字机 <AC自动机+Fail树+树状数组>

BZOJ2434 阿狸的打字机

阿狸喜欢收藏各种稀奇古怪的东西,最近他淘到一台老式的打字机。打字机上只有28个按键,分别印有26个小写英文字母和'B'、'P'两个字母。
经阿狸研究发现,这个打字机是这样工作的:
·输入小写字母,打字机的一个凹槽中会加入这个字母(这个字母加在凹槽的最后)。
·按一下印有'B'的按键,打字机凹槽中最后一个字母会消失。
·按一下印有'P'的按键,打字机会在纸上打印出凹槽中现有的所有字母并换行,但凹槽中的字母不会消失。
例如,阿狸输入aPaPBbP,纸上被打印的字符如下:
a
aa
ab
我们把纸上打印出来的字符串从1开始顺序编号,一直到n。打字机有一个非常有趣的功能,在打字机中暗藏一个带数字的小键盘,在小键盘上输入两个数(x,y)(其中1≤x,y≤n),打字机会显示第x个打印的字符串在第y个打印的字符串中出现了多少次。
阿狸发现了这个功能以后很兴奋,他想写个程序完成同样的功能,你能帮助他么?

Input
输入的第一行包含一个字符串,按阿狸的输入顺序给出所有阿狸输入的字符。
第二行包含一个整数m,表示询问个数。
接下来m行描述所有由小键盘输入的询问。其中第i行包含两个整数x, y,表示第i个询问为(x, y)。
Output
输出m行,其中第i行包含一个整数,表示第i个询问的答案。

Sample Input
aPaPBbP
3
1 2
1 3
2 3
Sample Output
2
1
0

Hint
1<=N<=10^5
1<=M<=10^5
输入总长<=10^5

标签:AC自动机 Fail树 树状数组

这道题的提示还是很明显的。
读完题目,很容易发现此题打字的部分就是在建一棵Trie树。
输入小写字母即在Trie中添加一个子结点并向儿子结点走,输入‘B'即退回到父结点,输入’P‘即在当前结点打标记。
因而我们可以构建Trie树如下:

void init() {
    //我写Trie树的习惯:把根节点定为1
	cnt = 0, root = 1, fa[root] = 0;
	//0号节点所有儿子都练到根,这样AC自动机CalcFail时更方便
	for (int i = 0; i < 26; i++)	trie[0][i] = root;
}
void build() {
	init();
	n = strlen(s);
	ind = 1;//ind记录当前结点数
	for (int i = 0, cur = root; i < n; i++) {
		if (s[i] == 'B') {
			//退到父结点
			cur = fa[cur];
		} else if (s[i] == 'P') {
			//打标记,标记为第cnt个字符串
			pos[++cnt] = cur;
		} else {
			//新建子结点
			trie[cur][s[i]-'a'] = ++ind;
			fa[ind] =cur, cur = ind;`
		}。
。
	}
}

接下来我们对付这题的询问。
首先,它要求一个字符串在另一个字符串中出现多少次,这显然是AC自动机的操作,所以我们建立fail数组如下:

void CalcFail() {
	queue <int> que;
	que.push(root);
	while (!que.empty()) {
		int u = que.front();
		for (int i = 0; i < DICNUM; i++) {
			if (trie[u][i]) {
				fail[trie[u][i]] = trie[fail[u]][i];
				que.push(trie[u][i]);
			} else {
				trie[u][i] = trie[fail[u]][i];
			}
		}
		que.pop();
	}
}

现在我们考虑fail数组的实质。如果A结点的fail指向B结点,则B结点代表的字符串一定是A结点代表字符串的后缀,即经过A的所有路径组成的字符串都包含B结点代表的字符串。对于一个字符串,它的所有字串为它所有前缀的所有后缀,所以对于询问(x,y),我们需要找出从根节点到y的路径中有多少结点可以通过fail指针转移到x。
这时我们就需要考虑Fail树了。对于任意结点p,我们把所有通过fail指针能直接转移到p的结点作为p的子结点,而p通过fail指针转移到的结点作为p的父结点。这样我们就能构建一棵树。这样一来,对于询问(x,y),问题等价于从根到y的结点中有多少节点是在x的子树中。我们就可以用DFS序操作。然后用树状数组维护(线段树太麻烦)。
为了使询问变得更好操作,我们考虑把询问按y值排序,这样我们就只需一直往下走,然后标记经过的结点,然后统计x子树即可。

最后附上AC代码:

#include <iostream>
#include <cstdio>
#include <queue>
#include <vector>
#include <cstring>
#include <algorithm>
#define MAX_N 100000
#define DICNUM 26
using namespace std;
int n, m, cnt, ind;
int root, trie[MAX_N+5][DICNUM], fa[MAX_N+5], fail[MAX_N+5], pos[MAX_N+5], ans[MAX_N+5];
char s[MAX_N+5];
vector <int> G[MAX_N+5];
int into[MAX_N+5], outo[MAX_N+5];
int tr[MAX_N+5];
struct Query {int x, y, id;} q[MAX_N+5];
bool cmp (const Query &a, const Query &b) {return a.y < b.y;}
void init() {
	cnt = 0, root = 1, fa[root] = 0;
	for (int i = 0; i < DICNUM; i++)	trie[0][i] = root;
}
void CalcFail() {
	queue <int> que;
	que.push(root);
	while (!que.empty()) {
		int u = que.front();
		for (int i = 0; i < DICNUM; i++) {
			if (trie[u][i]) {
				fail[trie[u][i]] = trie[fail[u]][i];
				que.push(trie[u][i]);
			} else {
				trie[u][i] = trie[fail[u]][i];
			}
		}
		que.pop();
	}
}
void DFS(int u) {
	into[u] = ++ind;
	for (int i = 0; i < G[u].size(); i++)	DFS(G[u][i]);
	outo[u] = ind;
}
void build() {
	init();
	n = strlen(s);	ind = 1;
	for (int i = 0, cur = root; i < n; i++) {
		if (s[i] == 'B') {
			cur = fa[cur];
		} else if (s[i] == 'P') {
			pos[++cnt] = cur;
		} else {
			trie[cur][s[i]-'a'] = ++ind;
			fa[ind] = cur, cur = ind;
		}
	}
	CalcFail();
	for (int i = 1; i <= ind; i++)	G[fail[i]].push_back(i);
	ind = 0;
	DFS(root);
}
void inc(int pos) {for (; pos <= ind; pos += pos&(-pos))	tr[pos]++;}
void dec(int pos) {for (; pos <= ind; pos += pos&(-pos))	tr[pos]--;}
int sum(int pos) {int ret = 0; for (; pos; pos -= pos&(-pos))	ret += tr[pos]; return ret;}
void solve() {
	sort(q, q+m, cmp);
	for (int i = 0, j = 0, cur = root, now = 0; i < n; i++)
		if (s[i] == 'B') {
			dec(into[cur]);
			cur = fa[cur];
		} else if (s[i] == 'P') {
			now++;
			for (; j < m && q[j].y == now; j++)
				ans[q[j].id] = sum(outo[pos[q[j].x]])-sum(into[pos[q[j].x]]-1);
		} else {
			cur = trie[cur][s[i]-'a'];
			inc(into[cur]);
		}
}
int main() {
	scanf("%s", s);
	build();
	scanf("%d", &m);
	for (int i = 0; i < m; i++)	scanf("%d%d", &q[i].x, &q[i].y), q[i].id = i;
	solve();
	for (int i = 0; i < m; i++)	printf("%d
", ans[i]);
	return 0;
}
原文地址:https://www.cnblogs.com/AzraelDeath/p/7561725.html