SAM求多个串的最长公共子串

又学到一个(SAM)的新套路QvQ

思路

考虑用其中的一个串建个(SAM),然后用其他的串在上面匹配,匹配时更新答案
首先有一个全局变量(len),表示当前已匹配的长度。假设目前在点(u),转移方式如下(根节点为(1)):
如果没有对应的转移边,就走后缀连接,(u=suflink(u)),并令(len=maxlen(suflink(u)))。否则走对应的转移边,同时(len++)。如果一直没有对应的转移边,即到最后发现(u=0),就把(u)置为(1)(len)置为(0),并开始下个字符的匹配
开一个数组(mx)记录每个结点被匹配时的(len)最大是多少,全部匹配完后还要拓扑排序一遍,把每个结点的(mx)上传给其(parent tree)上的祖先。对于一个结点(u),它所代表的(lcs)长度为每个字符串匹配完后(mx)中的最小值,每次更新一下就行了

代码

#include <bits/stdc++.h>

using namespace std;

#define N 100000

int m, n, root = 1, nid = 1, last = 1, maxlen[2*N+5], ch[2*N+5][26], link[2*N+5], mx[2*N+5], mn[2*N+5], len;
int tmp[2*N+5], a[2*N+5];

void insert(int c) {
  int cur = ++nid;
  maxlen[cur] = maxlen[last]+1;
  while(last && !ch[last][c]) ch[last][c] = cur, last = link[last];
  if(!last) link[cur] = root;
  else {
    int p = last, q = ch[last][c];
    if(maxlen[q] == maxlen[p]+1) link[cur] = q;
    else {
      int clone = ++nid;
      maxlen[clone] = maxlen[p]+1;
      for(int i = 0; i < 26; ++i) ch[clone][i] = ch[q][i];
      link[clone] = link[q]; link[q] = link[cur] = clone;
      while(p && ch[p][c] == q) ch[p][c] = clone, p = link[p];
    }
  }
  last = cur;
}

void radixSort() {
  memset(tmp, 0, sizeof tmp);
  for(int i = 1; i <= nid; ++i) tmp[maxlen[i]]++;
  for(int i = 1; i <= m; ++i) tmp[i] += tmp[i-1];
  for(int i = 1; i <= nid; ++i) a[tmp[maxlen[i]]--] = i;
  for(int i = nid; i >= 1; --i)
    mx[link[a[i]]] = max(mx[link[a[i]]], min(maxlen[link[a[i]]], mx[a[i]])), mn[a[i]] = min(mn[a[i]], mx[a[i]]);
}

void calc(char *s) {
  n = strlen(s);
  memset(mx, 0, sizeof mx);
  int u = root;
  len = 0;
  for(int i = 0; i < n; ++i) {
    while(u && !ch[u][s[i]-'a']) u = link[u], len = maxlen[u];
    if(!u) u = root;
    else {
      u = ch[u][s[i]-'a'];
      len++;
      mx[u] = max(mx[u], len);
    }
  }
  radixSort();
}

int main() {
  char s[N+5];
  scanf("%s", s);
  m = strlen(s);
  for(int i = 0; i < m; ++i) insert(s[i]-'a');
  memset(mn, 0x3f, sizeof mn);
  while(~scanf("%s", s)) calc(s);
  int ans = 0;
  for(int i = 1; i <= nid; ++i) ans = max(ans, mn[i]);
  printf("%d
", ans);
  return 0;
}

例题

SP1811
SP1812
SP10570
[SDOI2008]Sandy的卡片

原文地址:https://www.cnblogs.com/dummyummy/p/10746700.html