[BZOJ1921] [CTSC2010]珠宝商

Description

img

Input

第一行包含两个整数 N,M,表示城市个数及特征项链的长度。 接下来的N-1 行, 每行两个整数 x,y, 表示城市 x 与城市 y 有直接道路相连。城市由1~N进行编号。接下来的一行,包含一个长度为 N,仅包含小写字母的字符串,第 i 位的字符表示在城市 i 流行的原料类型。 最后一行, 包含一个长度为 M, 仅包含小写字母的字符串, 表示特征字符串。

Output

仅包含一个整数,为 N2 * Expectation

Sample Input

3 5 
1 2 
1 3 
aab 
abaab  

Sample Output

15 

Solution

点分治+后缀自动机....

思路是真的神奇...看了好久题解才看明白。

先考虑暴力,有一个很显然的(O(n^2))的暴力:

  • 枚举每个点作为起点,(dfs)另一个点,(dfs)的同时在特征字符串(S)(SAM)上跑,顺便统计答案就好了。
  • 这个在(SAM)上跑实际上就相当于每次在一个已经匹配了的串后面加一个字符,那么直接沿着(SAM)的转换边走就好了。

换个角度思考,还有另一种暴力:

  • 枚举一个点(x),统计出每条以这个点为(lca)的路径的代价。
  • 考虑这个看起来高级一点的暴力怎么做,
  • 对于点(x),路径肯定是(a o x o b)的形式,那么我们把他拆成两段(a o x)(x o b),注意到如果我们把特征字符串反过来,那么这两种其实就是一样的,所以我们现在考虑(a o x)怎么统计,然后在翻转过的(S)上再做一遍就好了。
  • 那么我们就是要统计出对于自动机上的点(i),有多少以(x)结尾的路径字符串在这个点。
  • 那么问题就相当于当前已经匹配了一个串,要在这个串前面加一个字符,那么沿着(parent)树跳就好了。
  • 最后答案就是对于字符串上每个点,这个点开始和这个点结束的方案之积 的和。

注意到第二种暴力可以用点分治优化,那么第二种暴力的复杂度就是(O(nlog n+nm))

考虑如何把后面一项优化一下,注意到第一种方案是不需要每次都扫一遍自动机的,所以可以在点分治的时候设一个阀值(B),若(size>B)就用第二种,否则用第一种。

可以发现当(B=sqrt{n})的时候复杂度最优,此时时间复杂度为(O((n+m)sqrt{n}))

#include<bits/stdc++.h>
using namespace std;

#define ll long long 

void read(int &x) {
    x=0;int f=1;char ch=getchar();
    for(;!isdigit(ch);ch=getchar()) if(ch=='-') f=-f;
    for(;isdigit(ch);ch=getchar()) x=x*10+ch-'0';x*=f;
}
 
void print(ll x) {
    if(x<0) putchar('-'),x=-x;
    if(!x) return ;print(x/10),putchar(x%10+48);
}
void write(ll x) {if(!x) putchar('0');else print(x);putchar('
');}

const int maxn = 2e5+10;
const int inf = 1e9;

ll ans;
char s[maxn];
int n,m,rt,siz,B,top;
int head[maxn],tot,a[maxn];
int vis[maxn],f[maxn],sz[maxn],tmp[maxn],t[maxn];
struct edge{int to,nxt;}e[maxn<<1];

void ins(int u,int v) {e[++tot]=(edge){v,head[u]},head[u]=tot;}

struct Suffix_Automaton {
	int cnt,qs,lstp;
	int par[maxn],tr[maxn][26],ml[maxn],pos[maxn],sz[maxn];
	int t[maxn],r[maxn],son[maxn][26],str[maxn],tag[maxn],rev[maxn];

	void append(int x,int v) {
		int p=lstp,np=++cnt;pos[np]=v,sz[np]=1,ml[np]=ml[p]+1,rev[v]=np;lstp=np;
		for(;p&&tr[p][x]==0;p=par[p]) tr[p][x]=np;
		if(!p) return par[np]=qs,void();
		int q=tr[p][x];
		if(ml[p]+1<ml[q]) {
			int nq=++cnt;ml[nq]=ml[p]+1;
			memcpy(tr[nq],tr[q],sizeof tr[nq]);
			par[nq]=par[q],par[q]=par[np]=nq;
			for(;p&&tr[p][x]==q;p=par[p]) tr[p][x]=nq;
		} else par[np]=q;
	}

	void prepare(char *ss) {
		lstp=qs=cnt=1;
		for(int i=1;i<=m;i++) append(str[i]=ss[i]-'a',i);

		for(int i=1;i<=cnt;i++) t[ml[i]]++;
		for(int i=1;i<=m;i++) t[i]+=t[i-1];
		for(int i=1;i<=cnt;i++) r[t[ml[i]]--]=i;

		for(int i=cnt;i;i--) {
			int p=r[i];
			sz[par[p]]+=sz[p];
			if(!pos[par[p]]) pos[par[p]]=pos[p];
			son[par[p]][str[pos[p]-ml[par[p]]]]=p;
		}
	}

	void mark(int x,int fa,int now,int len) {
		if(len==ml[now]) now=son[now][a[x]];
		else if(str[pos[now]-len]!=a[x]) now=0;
		if(!now) return ;len++;tag[now]++;
		for(int i=head[x];i;i=e[i].nxt)
			if(e[i].to!=fa&&!vis[e[i].to]) mark(e[i].to,x,now,len);
	}

	void push() {for(int i=1;i<=cnt;i++) tag[r[i]]+=tag[par[r[i]]];}
}sam1,sam2;

void get_rt(int x,int fa) {
	sz[x]=1,f[x]=0;
	for(int i=head[x];i;i=e[i].nxt)
		if(e[i].to!=fa&&!vis[e[i].to]) 
			get_rt(e[i].to,x),sz[x]+=sz[e[i].to],f[x]=max(f[x],sz[e[i].to]);
	f[x]=max(f[x],siz-sz[x]);
	if(f[x]<f[rt]) rt=x;
}

void get_node(int x,int fa) {
	t[++top]=x;
	for(int i=head[x];i;i=e[i].nxt)
		if(e[i].to!=fa&&!vis[e[i].to]) get_node(e[i].to,x);
}

void dfs(int x,int fa,int now) {
	now=sam1.tr[now][a[x]];
	if(!now) return ;
	ans+=sam1.sz[now];
	for(int i=head[x];i;i=e[i].nxt)
		if(e[i].to!=fa&&!vis[e[i].to]) dfs(e[i].to,x,now);
}

void work(int x,int fa,int op) {
	memset(sam1.tag,0,(sam1.cnt+2)*4);
	memset(sam2.tag,0,(sam2.cnt+2)*4);
	if(fa) sam1.mark(x,fa,sam1.tr[1][a[fa]],1),sam2.mark(x,fa,sam2.tr[1][a[fa]],1);
	else sam1.mark(x,fa,1,0),sam2.mark(x,fa,1,0);
	sam1.push(),sam2.push();
	for(int i=1;i<=m;i++) ans+=1ll*op*sam1.tag[sam1.rev[i]]*sam2.tag[sam2.rev[m-i+1]];
}

void solve(int x) {
	get_rt(x,0);siz=sz[x];
	if(siz<=B) {
		top=0,get_node(x,0);
		for(int i=1;i<=top;i++) dfs(t[i],0,sam1.qs);
		for(int i=1;i<=top;i++) vis[t[i]]=0;
		return ;
	}
	for(int i=head[x];i;i=e[i].nxt) tmp[e[i].to]=sz[e[i].to];
	work(x,0,1);
	for(int i=head[x];i;i=e[i].nxt) if(!vis[e[i].to]) work(e[i].to,x,-1);
	vis[x]=1;
	for(int i=head[x];i;i=e[i].nxt)
		if(!vis[e[i].to]) siz=tmp[e[i].to],rt=0,get_rt(e[i].to,x),solve(rt);
}

int main() {
	read(n),read(m);B=sqrt(n);
	for(int i=1,x,y;i<n;i++) read(x),read(y),ins(x,y),ins(y,x);
	scanf("%s",s+1);
	for(int i=1;i<=n;i++) a[i]=s[i]-'a';
	scanf("%s",s+1);
	sam1.prepare(s);
	reverse(s+1,s+m+1);
	sam2.prepare(s);
	siz=n,f[0]=inf,get_rt(1,0),solve(rt);write(ans);
	return 0;
}
原文地址:https://www.cnblogs.com/hbyer/p/10456260.html