计蒜客 UCloud 的安全秘钥(困难)(哈希)

UCloud 的安全秘钥(困难)

 

  •  9.53%
  •  1200ms
  •  262144K

每个 UCloud 用户会构造一个由数字序列组成的秘钥,用于对服务器进行各种操作。作为一家安全可信的云计算平台,秘钥的安全性至关重要。因此,UCloud 每年会对用户的秘钥进行安全性评估,具体的评估方法如下:

首先,定义两个由数字序列组成的秘钥 aa 和 bb 近似匹配(approx≈) 的关系。aa 和 bb 近似匹配当且仅当同时满足以下两个条件:

  • |a|=|b|a=b∣,即 aa 串和 bb 串长度相等。
  • 对于每种数字 cc,cc 在 aa 中出现的次数等于 cc 在 bb 中出现的次数。

此时,我们就称 aa 和 bb 近似匹配,即 a approx bab。例如,(1,3,1,1,2)approx(2,1,3,1,1)(1,3,1,1,2)(2,1,3,1,1)。

UCloud 每年会收集若干不安全秘钥,这些秘钥组成了不安全秘钥集合 TT。对于一个秘钥 ss 和集合 TT 中的秘钥 tt来说,它们的相似值定义为:ss 的所有连续子串中与 tt 近似匹配的个数。相似值越高,说明秘钥 ss 越不安全。对于不安全秘钥集合 TT 中的每个秘钥 tt,你需要输出它和秘钥 ss 的相似值,用来对用户秘钥的安全性进行分析。

输入格式

第一行包含一个正整数 nn,表示 ss 串的长度。

第二行包含 nn 个正整数 s_1,s_2,...,s_n(1leq s_ileq n)s1​​,s2​​,...,sn​​(1si​​n),表示 ss 串。

接下来一行包含一个正整数 mm,表示询问的个数。

接下来 mm 个部分:

每个部分第一行包含一个正整数 k(1leq kleq n)k(1kn),表示每个 tt 串的长度。

每个部分第二行包含 kk 个正整数 t_1,t_2,...,t_k(1leq t_ileq n)t1​​,t2​​,...,tk​​(1ti​​n),表示 TT 中的一个串 tt。

输入数据保证 TT 中所有串长度之和不超过 200000200000。

对于简单版本:1leq n,mleq 1001n,m100;

对于中等版本:1leq nleq 50000,1leq mleq 5001n50000,1m500;

对于困难版本:1 le n le 50000, 1 le m le 1000001n50000,1m100000。

输出格式

输出 mm 行,每行一个整数,即与 TT 中每个串 tt 近似匹配的 ss 的子串数量。

样例解释

对于第一个询问,(3,2,1,3)approx(2,3,1,3)(3,2,1,3)(2,3,1,3),(3,2,1,3)approx(3,1,3,2)(3,2,1,3)(3,1,3,2);

对于第二个询问,(1,3)approx(3,1)(1,3)(3,1),(1,3)approx(1,3)(1,3)(1,3);

对于第三个询问,(3,2)approx(2,3)(3,2)(2,3),(3,2)approx(3,2)(3,2)(3,2)。

样例输入

5
2 3 1 3 2
3
4
3 2 1 3
2
1 3
2
3 2

样例输出

2
2
2
【分析】给你一个原始数组,数组里每个数都<=n;然后K次询问,每次询问给出一个新的数组,问你原始数组中有多少连续子串是给定数组的
一种重新排列。
对于中等难度的,可以双指针搞一下,但是对于困难的就不会了,看了题解才知道...对于询问给定的数组的总长最大为2000000,而每次给
定的数组最长为50000.也就是说对于一个数组的长度m,不同的m的种数最多才650种。那么我们可以离线,将同种长度的存在一起。然后将
原始的数组的各种长度的m的哈希值算出来,然后排个序,对于此长度的询问的数组就可以根据哈希值二分来统计答案了。那么现在的问题是
怎么哈希...看了题解才知道后还有这种哈希的姿势,给每个数随机一个16位的数,就是ull rand()*rand()...学习到新知识了。
#include <bits/stdc++.h>
#define mp make_pair
#define pb push_back
#define met(a,b) memset(a,b,sizeof a)
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
typedef pair<int,int>pii;
const int N = 2e5+5;
const int mod = 1e9+7;
int n,m,k,u;
int a[N];
int b[N],ans[N];
ll has[N];
ull sum[N];
vector<pair<ull,int> >vec[N];
vector<int>c;
vector<ull>q;
int main()
{
    scanf("%d",&n);
    for(int i=1;i<=n;i++)has[i]=(ull)rand()*rand();
    for(int i=1; i<=n; i++){
        scanf("%d",&a[i]);
        sum[i]=sum[i-1]+has[a[i]];
    }
    scanf("%d",&k);
    for(int i=1;i<=k;i++){
        scanf("%d",&m);
        if(!b[m])c.pb(m),b[m]=1;
        ull  s=0;
        for(int i=1; i<=m; i++){
            scanf("%d",&u);
            s+=has[u];
        }
        vec[m].pb(mp(s,i));
    }
    for(int x:c){
        if(x>n){
            for(pair<ull,int> p : vec[x]){
                int id = p.second;
                ans[id]=0;
            }
        }
        else {
            ull  s=0;
            q.clear();
            for(int l=1,r=1;r<=n;r++){
                s+=has[a[r]];
                if(r-l+1==x){
                    q.pb(s);
                    s-=has[a[l++]];
                }
            }
            sort(q.begin(),q.end());
            for(pair<ull,int> p : vec[x]){
                int id = p.second;
                ull s = p.first;
                ans[id]=upper_bound(q.begin(),q.end(),s)-lower_bound(q.begin(),q.end(),s);
            }
        }
    }
    for(int i=1;i<=k;i++){
        printf("%d
",ans[i]);
    }
    return 0;
}
原文地址:https://www.cnblogs.com/jianrenfang/p/6939879.html