AcWing 831.KMP字符串

AcWing 831.KMP字符串

题目描述

给定一个模式串S,以及一个模板串P,所有字符串中只包含大小写英文字母以及阿拉伯数字。

模板串P在模式串S中多次作为子串出现。

求出模板串P在模式串S中所有出现的位置的起始下标。

输入格式

第一行输入整数N,表示字符串P的长度。

第二行输入字符串P。

第三行输入整数M,表示字符串S的长度。

第四行输入字符串S。

输出格式

共一行,输出所有出现位置的起始下标(下标从0开始计数),整数之间用空格隔开。

数据范围

1≤N≤104
1≤M≤105

输入样例:

3
aba
5
ababa

输出样例:

0 2

思路

利用KMP算法解决,这里讲一下自己理解的KMP算法

暴力的思路

一般匹配字符串时,我们从目标字符串str(假设长度为n)的第一个下标选取和ptr长度(长度为m)一样的子字符串进行比较,如果一样,就返回开始处的下标值,不一样,选取str下一个下标,同样选取长度为n的字符串进行比较,直到str的末尾(实际比较时,下标移动到n-m)。这样的时间复杂度是O(n*m)。

KMP

充分利用了目标字符串ptr的性质(比如里面部分字符串的重复性,即使不存在重复字段,在比较时,实现最大的移动量)
这样就能利用next数组存在ptr中每一位的相同的最长前缀和后缀,为了方便我们数组的下标从1开始

next数组的求法

	ne[1] = 0;//这里从1开始
	for (int i = 2, j = 0; i <= n; ++i) {
		while (j && p[j + 1] != p[i]) j = ne[j];
		
		if (p[j + 1] == p[i]) j++;

		ne[i] = j;
	}

上述代码中用j + 1是因为我们发现当字符不匹配的时候,前一个位置的next[j]值(不是这样也行,个人习惯),如果不匹配就像前退,知道匹配或者j = 0(j = 0就是退无可退,已经到最前面了),可以利用前面已经匹配的数据更快的找出位置(感觉有点像DP)。
匹配的时候,因为前面的已经匹配了j向后走,如果不匹配就向前退。

匹配

图解:

for (int i = 1, j = 0; i <= n; i ++ )
{
    while (j && s[i] != p[j + 1]) j = ne[j];
    if (s[i] == p[j + 1]) j ++ ;
    if (j == m)
    {
        j = ne[j];
        // 匹配成功后的逻辑
    }
}

题解

#include <iostream>
#include <string>

using namespace std;

const int N = 10010;
const int M = 100010;
int ne[N];//把每一个点为终点的最长相同前缀和后缀的长度存在里面
char s[M], p[N];

int main() {
	int n, m;

	cin >> n >> p + 1 >> m >> s + 1;

	ne[1] = 0;//这里从1开始
	for (int i = 2, j = 0; i <= n; ++i) {
		while (j && p[j + 1] != p[i]) j = ne[j];
		
		if (p[j + 1] == p[i]) j++;

		ne[i] = j;
	}

	for (int i = 1, j = 0; i <= m; ++i) {
		while (j && s[i] != p[j + 1]) j = ne[j];

		if (s[i] == p[j + 1]) j++;
		if (j == n) {
		    j = ne[j];
			cout << i - n << ' ';
		}
	}

	return 0;
}
原文地址:https://www.cnblogs.com/Lngstart/p/12288392.html