Luogu P3375 【模板】KMP字符串匹配

P3375 【模板】KMP字符串匹配

题目描述

如题,给出两个字符串s1和s2,其中s2为s1的子串,求出s2在s1中所有出现的位置。

为了减少骗分的情况,接下来还要输出子串的前缀数组next。如果你不知道这是什么意思也不要问,去百度搜[kmp算法]学习一下就知道了。

输入输出格式

输入格式:

第一行为一个字符串,即为s1(仅包含大写字母)

第二行为一个字符串,即为s2(仅包含大写字母)

输出格式:

若干行,每行包含一个整数,表示s2在s1中出现的位置

接下来1行,包括length(s2)个整数,表示前缀数组next[i]的值。

输入输出样例

输入样例#1:
ABABABC
ABA
输出样例#1:
1
3
0 0 1 

说明

时空限制:1000ms,128M

数据规模:

设s1长度为N,s2长度为M

对于30%的数据:N<=15,M<=5

对于70%的数据:N<=10000,M<=100

对于100%的数据:N<=1000000,M<=1000

样例说明:

所以两个匹配位置为1和3,输出1、3

Solution

从matrix67的blog上学习了一下,

设要在A中找B,朴素的匹配方法就是从1 to len(A)每次copy一段len(B)长的和B比较

但是KMP定义了一个next数组

表示对于某个字符串S的前i个字符构成的子串,既是它的后缀又是它的前缀的字符串中(它本身除外),最长的长度记作next[i]

那么我们在朴素匹配失败时可以相当于把模式串往右移动next[i]可以了

具体见KMP算法详解-Matrix67: The Aha Moments

Codes

 1 program wonder;
 2 var
 3     a,b:ansistring;//!!!
 4     i,j,la,lb,tot:longint;
 5     next:array[1..1000] of longint;
 6 
 7 procedure iii(i:longint);//找到了
 8 begin
 9     writeln(i-lb+1);
10     j:=next[j];
11 end;
12 
13 begin
14     readln(a);
15     readln(b);
16     la:=length(a);
17     lb:=length(b);
18 
19     next[1]:=0;
20     j:=0;
21     for i:= 2 to lb do
22       begin
23           while (j>0) and (b[i]<>b[j+1]) do j:=next[j];
24           if b[i]=b[j+1] then j:=j+1;
25           next[i]:=j;
26       end;
27 
28    j:=0;
29    for i:= 1 to la do
30      begin
31        while (j>0) and (a[i]<>b[j+1]) do j:=next[j];
32        if a[i]=b[j+1] then inc(j);
33        if j=lb then iii(i);
34      end;
35 
36    for i:= 1 to lb do write(next[i],' ');
37 end.
原文地址:https://www.cnblogs.com/bobble/p/6918681.html