[AHOI 2013] 差异

( ext{Update on 2020.12.20})

突然发现自己之前写过,但是现在写了篇新的。。。

所以把新的放这儿吧。

( ext{Description})

传送门

( ext{Solution})

(len) 的答案显然是 (n*(n+1)/2*(n-1)),我们只用考虑后面的 ( ext{LCP})

转化一下就是求任意两个后缀的 ( ext{LCP}) 之和,放到后缀数组上来说,就是任取 (1le i<jle n),求一次 (min{h[k]},(min{rk[i],rk[j]}le kle max{rk[i],rk[j]})),再将每次的答案相加(其中 (h[i]) 是后缀排序后第 (i) 位与第 (i-1) 位的 ( ext{LCP})(rk[i]) 是编号为 (i) 的后缀的排名)。

再转化一下,我们发现这其实就是 (h) 数组中任取 (1le i<jle n),求 (min{h[k]},(ile kle j)),再将每次的答案相加。

有一个经典的转化:我们可以固定位置 (pos),求在 (pos) 左边第一个 (h) 小于 (h[pos])(L[pos]),在 (pos) 右边第一个 (h) 小于 (h[pos])(R[pos])。答案就是:

[sum_{i=1}^n h[i] imes (i-L[i]) imes (R[i]-i) ]

是不是哪里有点不对?

上面的转化是在保证没有元素相同,而且可以取 (i=j) 的情况。

而这道题的元素可以相同就有点难搞。

还有一个很经典的转化(为什么我全都不会啊喂):可以人为给相同的元素按在数组的顺序赋优先级。

需要注意的是,(h[i]) 代表的是 (i)(i-1)( ext{LCP}),就是表示的不是单点,所以之前统计的配对和是 ([L[i],i])([i,R[i]]),而现在的配对和应该是 ([L[i],i-1])([i,R[i]-1])(可以看个示意图)。

[1 2 3 ... L[i] ... i ... R[i] ]

[ 6 7 5 ]

第一排是下标,第二排是 (h) 值。

具体做法就是用单调栈维护单增与不减,注释会比较详细。

( ext{Code})

#include <cstdio>

#define rep(i,_l,_r) for(register signed i=(_l),_end=(_r);i<=_end;++i)
#define fep(i,_l,_r) for(register signed i=(_l),_end=(_r);i>=_end;--i)
#define erep(i,u) for(signed i=head[u],v=to[i];i;i=nxt[i],v=to[i])
#define efep(i,u) for(signed i=Head[u],v=to[i];i;i=nxt[i],v=to[i])
#define print(x,y) write(x),putchar(y)

template <class T> inline T read(const T sample) {
    T x=0; int f=1; char s;
    while((s=getchar())>'9'||s<'0') if(s=='-') f=-1;
    while(s>='0'&&s<='9') x=(x<<1)+(x<<3)+(s^48),s=getchar();
    return x*f;
}
template <class T> inline void write(const T x) {
    if(x<0) return (void) (putchar('-'),write(-x));
    if(x>9) write(x/10);
    putchar(x%10^48);
}
template <class T> inline T Max(const T x,const T y) {if(x>y) return x; return y;}
template <class T> inline T Min(const T x,const T y) {if(x<y) return x; return y;}
template <class T> inline T fab(const T x) {return x>0?x:-x;}
template <class T> inline T gcd(const T x,const T y) {return y?gcd(y,x%y):x;}
template <class T> inline T lcm(const T x,const T y) {return x/gcd(x,y)*y;}
template <class T> inline T Swap(T &x,T &y) {x^=y^=x^=y;}

#include <cstring>
#include <iostream>
using namespace std;
typedef long long ll;

const int maxn=5e5+5;

char s[maxn];
int n,m='z',c[maxn],x[maxn],y[maxn],sa[maxn],num,rk[maxn],h[maxn],sta[maxn],tp,pre[maxn],suf[maxn];
ll ans;

void Suffix() {
	rep(i,1,n) ++c[x[i]=s[i]];
	rep(i,2,m) c[i]+=c[i-1];
	fep(i,n,1) sa[c[x[i]]--]=i;
	for(int k=1;k<=n;k<<=1) {
		num=0;
		rep(i,n-k+1,n) y[++num]=i;
		rep(i,1,n) if(sa[i]>k) y[++num]=sa[i]-k;
		rep(i,1,m) c[i]=0;
		rep(i,1,n) ++c[x[i]];
		rep(i,2,m) c[i]+=c[i-1];
		fep(i,n,1) sa[c[x[y[i]]]--]=y[i],y[i]=0;
		swap(x,y);
		x[sa[1]]=1; num=1;
		rep(i,2,n)
			x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
		m=num;
	}
}

void LCP() {
	int k=0;
	rep(i,1,n) rk[sa[i]]=i;
	rep(i,1,n) {
		if(rk[i]==1) continue;
		if(k) --k;
		int j=sa[rk[i]-1];
		while(j+k<=n&&i+k<=n&&s[j+k]==s[i+k]) ++k;
		h[rk[i]]=k;
	}
}

int main() {
	scanf("%s",s+1); n=strlen(s+1);
	Suffix(); LCP();
	sta[0]=1;
	rep(i,2,n) { // 维护单增,如果前面有相等的就停在第一个相等的位置
		while(tp&&h[sta[tp]]>h[i]) --tp;
		++tp;
		pre[sta[tp]=i]=sta[tp-1];
	}
	sta[tp=0]=n+1;
	fep(i,n,1) { // 维护不减
		while(tp&&h[sta[tp]]>=h[i]) --tp;
		++tp;
		suf[sta[tp]=i]=sta[tp-1];
	}
	rep(i,1,n) ans+=1ll*h[i]*(i-pre[i])*(suf[i]-i);
	print(1ll*n*(n+1)/2*(n-1)-2ll*ans,'
');
	return 0;
}

( ext{Old Version})

((displaystyle sum^{}_{1<=i<j<=n}{i+j})-2*displaystyle sum^{}_{1<=i<j<=n}{lcp(suf(i),suf(j))})

(=(n-1)*Σi-2*displaystyle sum^{}_{1<=i<j<=n}{lcp(suf(i),suf(j))})

(=frac{(n-1)*(1+n)*n}{2}-2*displaystyle sum^{}_{1<=i<j<=n}{lcp(suf(i),suf(j))})

注意前者的(i)(j)是转换了一下的,为了后面化简顺利。(也就是说前面的(i)(j)与后面的(i)(j)不是对应一样的)

我们就可以考虑后面的环节。因为暴枚的时间是(n)方,我们肯定过不去。所以只有用一个小一点的枚举。

可以利用(h)数组。因为两个后缀的(lcp)是排名在它们之间的串的(h)值的(min)。反过来思考,我们只要计算出以(i)为中心的(h)值比(h[i])大的连续区间的长度就行了。我们可以用单调栈维护。

统计出两边的个数后我们相乘就能得到(lcp)(h[i])的区间个数了。

注意处理最后仍未被弹出栈的元素。

#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <iostream>
using namespace std;

const int N = 5e5 + 3;

long long ans;
int cnt, l[N], r[N], s[N], lg[N], T, rmq[N][20], n, m, h[N], tax[N], SA[N], tp[N], rk[N], a[N];

int read() {
	int x = 0, f = 1; char S;
	while((S = getchar()) > '9' || S < '0') {
		if(S == '-') f = -1;
		if(S == EOF) exit(0);
	}
	while(S <= '9' && S >= '0') {
		x = (x << 1) + (x << 3) + (S ^ 48);
		S = getchar();
	}
	return x * f;
}

bool cmp(const int x, const int y, const int d) {return tp[x] == tp[y] && tp[x + d] == tp[y + d];}

void Sort() {
    for(int i = 0; i <= m; ++ i) tax[i] = 0;
    for(int i = 1; i <= n; ++ i) ++ tax[rk[tp[i]]];
    for(int i = 1; i <= m; ++ i) tax[i] += tax[i - 1];
    for(int i = n; i >= 1; -- i) SA[tax[rk[tp[i]]] --] = tp[i];
}

void Swap(int &x, int &y) {
    x ^= y ^= x ^= y;
}

int Min(const int x, const int y) {
    if(x < y) return x;
    return y;
}

void Suffix() {
    for(int i = 1; i <= n; ++ i) rk[i] = a[i], tp[i] = i;
    m = 122; Sort();
    for(int w = 1, p = 1, i; p < n; m = p, w <<= 1) {
        for(p = 0, i = n - w + 1; i <= n; ++ i) tp[++ p] = i;
        for(i = 1; i <= n; ++ i) if(SA[i] > w) tp[++ p] = SA[i] - w;
        Sort(); swap(rk, tp); rk[SA[1]] = p = 1;
        for(i = 2; i <= n; ++ i) rk[SA[i]] = cmp(SA[i], SA[i - 1], w) ? p : ++ p;
    }
    int j, k = 0;
    for(int i = 1; i <= n; h[rk[i ++]] = k)
        for(k = k ? k - 1 : k, j = SA[rk[i] - 1]; a[i + k] == a[j + k]; ++ k);
    for(int i = 1; i <= n; ++ i) rmq[i][0] = h[i];
    for(int j = 1; (1 << j) <= n; ++ j)
        for(int i = 1; i + (1 << j) - 1 <= n; ++ i)
            rmq[i][j] = Min(rmq[i][j - 1], rmq[i + (1 << j - 1)][j - 1]);
}

int lcp(const int x, const int y) {
    int l = rk[x], r = rk[y];
    if(l > r) Swap(l, r);
    int t = lg[r - l];
    return Min(rmq[l + 1][t], rmq[r - (1 << t) + 1][t]);
}

int main() {
    char ch[N];
    scanf("%s", ch); n = strlen(ch);
    for(int i = 1; i <= n; ++ i) a[i] = ch[i - 1];
    Suffix();
    ans = 1ll * n * (n - 1) * (n + 1) / 2;
    s[cnt = 1] = 1;
    for(int i = 2; i <= n; ++ i) {
        while(cnt && h[s[cnt]] > h[i]) r[s[cnt --]] = i;
        l[i] = s[cnt];
        s[++ cnt] = i;
    }
    while(cnt) r[s[cnt --]] = n + 1;
    for(int i = 2; i <= n; ++ i)
        ans -= 2ll * (i - l[i]) * (r[i] - i) * h[i];
    printf("%lld
", ans);
    return 0;
}

原文地址:https://www.cnblogs.com/AWhiteWall/p/12394034.html