KMP算法学习

最近在看算法,觉得kmp算法的一些学习心得可以记录一下。

我本身是在看《算法》的,里面介绍kmp算法时,实在看的一脸懵逼,就看了别人的心得,这里推荐2篇博文:

1.阮一峰大大的:http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html

2.实现1中求next的博文:http://www.cnblogs.com/c-cloud/p/3224788.html

根据1文我实现了kmp,但留空next的求法,毕竟1文也只是大概说了next的意义,对2文我在自己的理解上也自己实现了一波,觉得更加容易懂些吧。

个人添加的理解(也都在注释里了):

  1.next的本质是最长共同前缀后缀,然后在匹配失败时,指向模板字符串的指针直接重置为next[k-1](即重置到最长共同前后缀的下一个位置),而长字符串的指针勿需动,即相当于指针新位置前的那一坨已经匹配成功了,接着从新指针那里匹配下去即可

  2.(参考下面代码)计算next时,如果p[i]=p[k]则共同前后缀+1,不等则在已经匹配成功的部分p[0~k-1]中找最大共同前后缀next[k-1],然后继续比较p[i]和p[新k],如果k<=0即得不到已经存在的next的帮助了,这时k=0,即木有共同前后缀了。

// next的本质是最长共同前缀后缀,然后在匹配失败时,指向模板字符串的指针直接重置为next[k-1],而长字符串的指针勿需动,即相当于指针新位置前的那一坨已经匹配成功了,接着从新指针那里匹配下去即可
    void CalculateNext(string pattern, ref int[] next)
    {
        next[0] = 0;
        for (int i = 1, k = 0; i < pattern.Length; ++i)
        {
            while(pattern[i] != pattern[k])
            {
                if (k > 0)
                    k = next[k - 1];//这个有点难理解,因为她是匹配失败后(p[i]!=p[k]),
                                    //直接使用匹配成功部分的共同前后缀接着进行匹配p[i]和p[新k],此时因为新k=next[k-1],所以p[x~i]=p[0-新k]
                else
                {
                    k = -1;//得不到前面next的帮助了,需要置k=0,并且需要跳出while
                    break;
                }
            }

            k++;
            next[i] = k;
        }
    }

    void KMP(string inStr, string pattern, int[] next)
    {
        for (int i = 0, k = 0; i < inStr.Length; i++)
        {
            if (pattern[k] == inStr[i])
            {
                k++;
                if (k == pattern.Length)
                {
                    break;
                }
            }
            else
            {
                if (k != 0)//k=0特殊处理,直接移动i即可,k依然是0
                {
                    k = next[k-1];//一开始我是用1文的说法(移动位数 = 已匹配的字符数 - 对应的部分匹配值):pattern右移d=k-next[k-1],即k需回退x才能维持和i对应(分别对着两字符串的下一个比较字符),x=k-d=next[k-1]
                    //即,k=next[k-1],所以理解为:k应该重置到最长共同前后缀的下一个位置,这样比1文的说法容易理解些(因为next里是长度,k是下标,所以刚好next[k-1]就是最长共同前后缀的下一个位置的下标) } } } }
原文地址:https://www.cnblogs.com/Tearix/p/7536744.html