luogu P3370 【模板】字符串哈希

P3370 【模板】字符串哈希

2017-09-02


题目描述

如题,给定N个字符串(第i个字符串长度为Mi,字符串内包含数字、大小写字母,大小写敏感),请求出N个字符串中共有多少个不同的字符串。


输入输出格式

输入格式:

第一行包含一个整数N,为字符串的个数。

接下来N行每行包含一个字符串,为所提供的字符串。

输出格式:

输出包含一行,包含一个整数,为不同的字符串个数。


输入输出样例

INPUT_1

7
bjcxg
bjbcxg
yyzcxg
bjxdxg
xgxg
xgxg
xgml

OUT_1
6


INPUT_2

3
ldaxc
xchld
djaxc

OUT_2

3
样例

时空限制:1000ms,128M

数据规模:

对于30%的数据:N<=10,Mi≈6,Mmax<=15;

对于70%的数据:N<=1000,Mi≈100,Mmax<=150

对于100%的数据:N<=10000,Mi≈1000,Mmax<=1500


哈希,把字符串通过某个变成大数字,保证相同的字符串产生的大数字不一样;然后pd是否相同

我用的双哈希,我才不信什么玄学单哈希能过

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cstdlib>
#include<cstring>
#define ll long long 
using namespace std;
struct saber{
ll x,y;
}ck[10000+999];
char a[5000];
int n;
const ll sen=131;
const ll mod1=23333333333ll;
const ll mod2=10000000007ll;
ll hax1(char s[]){
    ll ans=0;int len=strlen(s);
    for(int i=0;i<len;i++)
        ans=(ans*sen+(ll)s[i])%mod1;
    return ans%mod1;
}
ll hax2(char s[]){
    ll ans=0;int len=strlen(s);
    for(int i=0;i<len;i++)
        ans=(ans*sen+(ll)s[i])%mod2;
    return ans%mod2;
}
bool sa(saber x,saber y){
    if(x.x==x.y)return x.y<y.y;
    return x.x<y.x;
}
int main(){
    cin>>n;
    for(int i=1;i<=n;i++){
        cin>>a;
        ck[i].x=hax1(a);
        ck[i].y=hax2(a);
    }
    sort(ck+1,ck+1+n,sa);
    int re=0;
    for(int i=1;i<=n;i++){
        if((ck[i].x!=ck[i-1].x)||(ck[i].y!=ck[i-1].y))re++;}
    cout<<re;
    return 0;
}
哈希

by:s_a_b_e_r


自然溢出大法好(其实就是因为懒x

用unsigned long long存hash值,这样在超过2^64的时候会重新从0开始计数

就相当于自动%了一个2^64

偷懒专用w

(虽然可能会被卡,但是如果出题人很良心的话就没问题

//自然溢出 
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#define ull unsigned long long 
using namespace std;
ull base=131,a[10009],ans=1;
char s[1509];
ull hashs()
{
    ull re=0;
    int len=strlen(s);
    for(int i=0;i<len;++i)
    re=re*base+(ull)s[i];
    return re&0x7fffffff;
}
int main()
{
    int n;
    cin>>n;
    for(int i=1;i<=n;++i)
    {
      memset(s,0,sizeof(s));
      scanf("%s",s); 
      a[i]=hashs();
    }
    sort(a+1,a+n+1);
    for(int i=2;i<=n;++i)
    {if(a[i]!=a[i-1])++ans;}
    cout<<ans<<endl;
    return 0;
}
自然溢出hash

by:wypx


冰精吃西瓜
冰精不吃西瓜
幽幽子吃西瓜
冰精想冻西瓜
西瓜西瓜
西瓜西瓜
西瓜没了
吐槽

s:西瓜会被玩坏的x

w:你说的是那个在uuz肚子里的西瓜吗?

 

原文地址:https://www.cnblogs.com/ck666/p/7466871.html