CF985F Isomorphic Strings (字符串Hash,巧解)

题目链接

题意翻译

给你一个长度为 (n) 的字符串,(m) 次询问.
问两个相同长度的子串是否匹配.
我们称两个子串是匹配的,当且仅当其满足:
其中一个子串的字母可替代另一个子串的字母

例如,我们称 (orzzz)(yzkkk) 是匹配的,因为其满足交换条件:
(o) -> (y)
(r) -> (z)
(z) -> (k)
所以它们是匹配的.
同时输入中前两个为子串起点,最后一个为子串长度.

Solution

先补充一个知识点,子串哈希的性质:

若已知一个(|S|=n)的字符串的 (hash) 值, (hash[i],1≤i≤n,) 其子串 (sl..sr,1≤l≤r≤n) ; 其中 (hash[i]) 代表其从开始到第 (i) 位的 (hash)

对应的hash值为:

[hash=hash[r]-hash[l-1]*p^{r-l+1} ]

考虑到(hash[i])每次对(p)取模,进一步得到下面的式子:

[hash=(hash[r]-hash[l-1]*p^{r-l+1}+p)mod p ]

至此得到求子串 (hash) 值公式.


然后看**这道题的做法:** 我们先将所有相同的字母单独拎出来组成一个新的字符串,其余字符的位置补成$0$.

给一个例子:
(aaaba)(cccdc)

对于第一个子串:

(a:11101)
(b:00010)

第二个子串:

(c:11101)

(d:00010)

然后我们发现(a)(c)(Hash)值是相同的。
(b)(d)也是相同的,然后就匹配成功。

然后在每次询问将子串里诸如此类的(Hash)值求出来。
排一遍序,然后(O(26))找相同的即可,总体时间复杂度(O(n*26*log26).)


Code

#include<bits/stdc++.h>
#define ll long long
using namespace std;
const int maxn=200008;
const ll seed=23;
const ll mod=19260817;
string ch;
int n,m; 
ll hash[maxn][30];
ll cf[maxn];
ll a[30],b[30];

void pre()
{
	for(int j=1;j<=26;j++)
	for(int i=1;i<=n;i++)
	{
		 ll fuck=0;
		 if(ch[i]=='a'+j-1)fuck='#';
		 hash[i][j]=((hash[i-1][j]*seed)%mod+fuck)%mod;
	}
	cf[0]=1;
	for(int i=1;i<=n;i++)
	cf[i]=(cf[i-1]*seed)%mod;
	return;
}
 
void solve(int len,int s,int k)
{
	for(int i=1;i<=26;i++)
	{
		a[i]=(hash[s+len-1][i]-(hash[s-1][i]*cf[len]%mod)+mod)%mod;
		b[i]=(hash[k+len-1][i]-(hash[k-1][i]*cf[len]%mod)+mod)%mod;
	}
	sort(a+1,a+27);sort(b+1,b+27);
	for(int i=1;i<=26;i++)
	if(a[i]!=b[i]){cout<<"NO"<<endl;return;}
	cout<<"YES"<<endl;
} 
 
int main()
{
	ch='*';
	cin>>n>>m;
	string s; cin>>s;
	ch+=s;
	pre();
	for(int i=1;i<=m;i++)
	{
		int len,s,k;
		scanf("%d%d%d",&s,&k,&len);
		solve(len,s,k);
	}
}
原文地址:https://www.cnblogs.com/Kv-Stalin/p/9374469.html