[bzoj3555]企鹅QQ(hash)

3555: [Ctsc2014]企鹅QQ

Time Limit: 20 Sec  Memory Limit: 256 MB
Submit: 1645  Solved: 616
[Submit][Status][Discuss]

Description

PenguinQQ是中国最大、最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。
小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。
小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在给定的 个账户名称中,有多少对是相似的。
为了简化你的工作,小Q给你的 个字符串长度均等于 ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。

Input

第一行包含三个正整数 , , 。其中 表示账户名称数量, 表示账户名称长度, 用来表示字符集规模大小,它的值只可能为2或64。
若 等于2,账户名称中只包含字符‘0’和‘1’共2种字符;
若 等于64,账户名称中可能包含大小写字母、数字、下划线以及‘@’共64种字符。
随后 行,每行一个长度为 的字符串,用来描述一个账户名称。数据保证 个字符串是两两不同的。

Output

仅一行一个正整数,表示共有多少对相似的账户名称。

Sample Input

4 3 64
Fax
fax
max
mac

Sample Output

4

HINT

 4对相似的字符串分别为:Fax与fax,Fax与max,fax与max,max与mac。N<=30000,L<=200,S<=64 

 机房不能成为偷懒的理由!

还得好好写呀

那么再来一波hash

首先要想到枚举每一位哈希判断前后字符串是否相同

接下来是细节

判断前后相同有好多写法,这里直接预处理一个字符集的幂暴力减去即可

在取出某一位去掉后的哈希值后,再看如何算有几对

一种想法是把字符哈希值再哈希一遍,映射到键上模拟链表处理,不谈

另一种直接暴力快排即可

还有取模直接自然溢出就对了TAT 23333333333333333这个素数会被卡,害的我调了半天 

 1 #include<stdio.h>
 2 #include<stdlib.h>
 3 #include<string.h>
 4 #include<algorithm>
 5 #define ll unsigned long long
 6 using namespace std;
 7 //0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ_@
 8 //1234567890123456789012345678901234567890123456789012345678901234
 9 int num,len;
10 ll base;
11 ll hash[30030][210]={{0}},tmp[30030]={0},power[201]={0};
12 char read[30030][210];
13 ll chr(char a){
14    if(base==3){
15       return a=='0'?(ll)1:(ll)2;
16    }else{
17          if(a>='0'&&a<='9')return (ll)(a-'0'+1);
18          if(a>='a'&&a<='z')return (ll)(a-'a'+11);
19          if(a>='A'&&a<='Z')return (ll)(a-'A'+37);
20          if(a=='_')return (ll)63;
21          if(a=='@')return (ll)64;
22    }
23 }
24 int cal(){
25     for(int i=0;i<num;i++){
26         hash[i][0]=chr(read[i][0]);
27         for(int j=1;j<len;j++)hash[i][j]=(hash[i][j-1]*base+chr(read[i][j]));
28     }
29     return 0;
30 }
31 int main(){
32     scanf("%d %d %lld",&num,&len,&base);
33     base+=(ll)1;
34     int now=1,ans=0;
35     for(int i=0;i<num;i++)scanf("%s",read[i]);
36     cal();
37     power[0]=1;
38     for(int i=1;i<=len;i++)power[i]=power[i-1]*base;
39     for(int i=0;i<len;i++){
40         for(int j=0;j<num;j++)tmp[j]=hash[j][len-1]-chr(read[j][i])*power[len-i-1];
41         sort(tmp,tmp+num);
42         for(int j=1;j<num;j++){
43             if(tmp[j]==tmp[j-1]){
44                ans+=now;
45                now++;
46             }else now=1;
47         }
48     }
49     printf("%d",ans);
50     return 0;

51 } 

原文地址:https://www.cnblogs.com/Pumbit-Legion/p/5589573.html