CF954I Yet Another String Matching Problem(FFT+并查集)

给定两个字符串(S,T)

(S)所有长度为(|T|)子串与(T)的距离

两个等长的串的距离定义为最少的,将某一个字符全部视作另外一个字符的次数。

(|T|<=|S|<=10^6),字符集大小为(6)

题解

首先考虑对于两个长度相等的子串怎么比较他们的距离,那么就是一个CF939D Love Rescue,一遍扫过去,如果对应位置的字符不相等且不在同一个并查集内那么连边并(++ans)

因为字符集大小只有(6),边的种类只有(30)种,所以我们可以考虑对于每一个子串,每一条边是否要连。把(T)翻转,考虑枚举字符(i,j),把(S)(i)出现的位置对应为(1)(T)(j)出现的位置对应为(1),画个图理解一下,如果以(S)中以(x)结尾的长度为(|T|)的子串中有(i,j)这一条边,那么在把上式卷积之后,(x)位置肯定为不为(0)

于是暴力枚举字符集,对于每一个结尾位置维护一下边的情况,然后跑并查集就是了

//minamoto
#include<cstdio>
#include<cmath>
#include<cstring>
#include<iostream>
#define R register
#define fp(i,a,b) for(R int i=a,I=b+1;i<I;++i)
#define fd(i,a,b) for(R int i=a,I=b-1;i>I;--i)
#define go(u) for(int i=head[u],v=e[i].v;i;i=e[i].nx,v=e[i].v)
char buf[1<<21],*p1=buf,*p2=buf;
inline char getc(){return p1==p2&&(p2=(p1=buf)+fread(buf,1,1<<21,stdin),p1==p2)?EOF:*p1++;}
int read(){
    R int res,f=1;R char ch;
    while((ch=getc())>'9'||ch<'0')(ch=='-')&&(f=-1);
    for(res=ch-'0';(ch=getc())>='0'&&ch<='9';res=res*10+ch-'0');
    return res*f;
}
char sr[1<<21],z[20];int C=-1,Z=0;
inline void Ot(){fwrite(sr,1,C+1,stdout),C=-1;}
void print(R int x){
    if(C>1<<20)Ot();if(x<0)sr[++C]='-',x=-x;
    while(z[++Z]=x%10+48,x/=10);
    while(sr[++C]=z[Z],--Z);sr[++C]='
';
}
const int N=5e5+5;const double Pi=acos(-1.0);
struct complex{
	double x,y;
	complex(double xx=0,double yy=0){x=xx,y=yy;}
	inline complex operator +(const complex &b){return complex(x+b.x,y+b.y);}
	inline complex operator -(const complex &b){return complex(x-b.x,y-b.y);}
	inline complex operator *(const complex &b){return complex(x*b.x-y*b.y,x*b.y+y*b.x);}
}A[N],B[N],O[N];
int r[N],eq[N][6][6],fa[6],n,m,lim,l,res;
char a[N],b[N];
int find(int x){return fa[x]==x?x:fa[x]=find(fa[x]);}
void FFT(complex *A,int ty){
	fp(i,0,lim-1)if(i<r[i])std::swap(A[i],A[r[i]]);
	for(R int mid=1;mid<lim;mid<<=1){
		int I=(mid<<1);complex Wn(cos(Pi/mid),ty*sin(Pi/mid));
		fp(i,1,mid-1)O[i]=O[i-1]*Wn;
		for(R int j=0;j<lim;j+=I)fp(k,0,mid-1){
			complex x=A[j+k],y=O[k]*A[j+k+mid];
			A[j+k]=x+y,A[j+k+mid]=x-y;
		}
	}
}
int main(){
//	freopen("testdata.in","r",stdin);
	scanf("%s%s",a,b);
	n=strlen(a),m=strlen(b);
	lim=1;while(lim<=n+m)lim<<=1,++l;O[0]=complex(1,0);
	fp(i,0,lim-1)r[i]=(r[i>>1]>>1)|((i&1)<<(l-1));
	fp(i,0,5)fp(j,0,5){
		fp(k,0,lim-1)A[k].x=B[k].x=A[k].y=B[k].y=0;
		fp(k,0,n-1)A[k].x=(a[k]==i+'a');
		fp(k,0,m-1)B[k].x=(b[m-k-1]==j+'a');
		FFT(A,1),FFT(B,1);
		fp(k,0,lim-1)A[k]=A[k]*B[k];
		FFT(A,-1);
		fp(k,0,lim-1)eq[k][i][j]=(int)(A[k].x/lim+0.5);
	}fp(i,m-1,n-1){
		fp(j,0,5)fa[j]=j;
		fp(j,0,5)fp(k,0,5)
			if(eq[i][j][k])fa[find(j)]=find(k);
		res=0;
		fp(j,0,5)if(find(j)!=j)++res;
		printf("%d ",res);
	}return 0;
}
原文地址:https://www.cnblogs.com/bztMinamoto/p/10212800.html