kmp算法

数据结构—KMP

参考文章https://www.cnblogs.com/wuwangchuxin0924/p/5986243.html

https://www.cnblogs.com/ciyeer/p/9035072.html

KMP算法用于解决两个字符串匹配的问题，但更多的时候用到的是next数组的含义，用到next数组的时候，大多是题目跟前后缀有关的。

首先介绍KMP算法：（假定next数组已经学会，后边next数组会在介绍）

上图T为主链，P为模板链，要求P在T中是否出现，出现就返回位置。

朴素算法会顺序遍历，比较第一次的时候p[0]处失配，然后向后移动继续匹配。数据量大的时候这么做肯定是不可行的。所以这里就会有KMP算法！在一次失配之后，KMP算法认为这里已经失配了，就不能在比较一遍了，而是将字符串P向前移动(已匹配长度-最大公共长度)位，接着继续比较下一个位置。这里已匹配长度好理解，但是最大公共长度是什么呐？这里就出现了next数组，next数组：next[i]表示的是P[0-i]最大公共前后缀公共长度。这里肯定又有人要问了，next数组这么奇葩的定义，为什么就能算出来字符串需要向后平移几位才不会重复比较呐？

上图中红星标记为例，此时在p[4]处失配，已匹配长度为4,而next[3]=2(也就是babaa中前后缀最大公共长度为0)，这时候向后平移已匹配长度-最大公共长度=2位,P[0]到达原来的P[2]的位置，如果只平移一位,P[0]到达p[1]的位置这个位置没有匹配这次操作就是无用功所以浪费掉了时间。已知前缀后缀中的最大公共长度，下次位移的时候直接把前缀位移到后缀上面直接产生匹配，这样直接从后缀的后一位开始比较就可以了。这样将一下无意义的位移过滤掉剩去了不少的时间。