数据结构(java语言描述)模式匹配——KMP算法

关于模式匹配算法,BF是比较号理解的,但是属于暴力匹配,资源浪费太严重。

KMP算法确实比较难懂(PS:反正我是看了好久才弄明白,可能也是我理解能力太差=_=)

下面是我的一些心得。

http://www.cnblogs.com/yjiyjige/p/3263858.html

这个是我在网上找到的一个网友的帖子,觉得将得很详细,看了之后恍然大悟。

1.原理

KMP算法原理就是在主串和子串做匹配的时候,每次遇到不想同的元素即不能继续匹配时,保持主串正在匹配的那个元素不变,至变更子串的元素(向前移动游标),从而达到减小时间复杂度的目的。即:“利用已经部分匹配这个有效信息,保持i指针不回溯,通过修改j指针,让模式串尽量地移动到有效的位置。”

结合这个帖子:http://www.cnblogs.com/tangzhengyue/p/4315393.html

我觉得最重要的是这个图要懂:

代码中,BMP方法部分相比于BF算法改动不大,主要是在判断条件上加了一个

当si=tj时,i/j分别加1,继续比较;

当si!=tj时,i值不变,j变为next(j),继续比较。

     做比较时有:1.j退回到next[j]时,若si=tj(tnext(j)),则i/j分别加1,继续比较,若si!=tj(tnext(j)),则j退回j=next[next[j]](即退回k=next[j],j=next[k],这是一个递归,直到k=-1,此时next[k]=0,k=1,next[k]=0);

           2.j退回到j=-1时,另主串和子串下标各加1

分析条件,子串中的元素要进行比较的情况有:如上黄颜色标出的情况,进行综合得:

有代码:

int j=-1;

while(i<p.length&&j<s.length){

   if(j==-1||p[i]==s[i]){

   i++;j++}

   else{

      j=next[j];}}

关于j的变化关系由一个next数组来存储。

对整个子串进行遍历:(0<=j<s.length-1)得到next[]数组的个元素

 int[] next1=new int[s.length];//next数组初始化
            next1[0]=-1;//next数组的第一个元素初始化
            int j=0;
            int k=-1;//初始化
            while(j<s.length-1)
            {
                if(k==-1||s[j]==s[k])//如果s[j]==s[k]或k==-1,则需要移动j,或则做单纯的做i++ j++,然后值j为0,子串从头开始
                {
                    if(s[++j]==s[++k]){
                        next1[j]=next1[k];
                    }else{
                        System.out.println("j:"+j);
                        System.out.println("k:"+k);
                        next1[j]=k;
                    }
                }else{//s[j]==s[k]和k==-1,都不满足,则往更深以层次比较next(k)
                    //此时s[j]!=s[k]
                    k=next1[k];//取k结束的串的最长匹配子串
                }

总代码:

package exercise;
import java.util.Scanner;
public class KMP {//与BF算法有四个不同的地方
    public static int km(String s1,String s2){
        char[] p=s1.toCharArray();
        char[] s=s2.toCharArray();
        int[] next=getnext(s2);//与BF算法相比多了一个next[]数组 1
        for(int l=0;l<next.length;l++){
            System.out.print(next[l]+" ");
        }
        int i=0;//主串
        int j=0;//子串
        while(i<p.length&&j<s.length){
            if(j==-1||p[i]==s[j]){//j==-1是当主串和子串的第一个元素不等时  多了一个j的判断条件 2
                i++;
                j++;
            }else{
                //与BF算法不同的是,此时i不在返回,只有j动   //i不动      3
                j=next[j];//j回到指定位置            
                //j不是移动到0,而智能的移动到字串中的最长匹配串的结束位置+1     4
            }
        }//while结束
        if(j==s.length){//s.length
            return i-j;
        }else{
            return -1;
        }
    }
    public static int[] getnext(String s2){
            char[] s=s2.toCharArray();//将要个生成next数组的子串转换为char数组
            int[] next1=new int[s.length];//next数组初始化
            next1[0]=-1;//next数组的第一个元素初始化
            int j=0;
            int k=-1;//初始化
            while(j<s.length-1)
            {
                if(k==-1||s[j]==s[k])//如果s[j]==s[k]或k==-1,则需要移动j,或则做单纯的做i++ j++,然后值j为0,子串从头开始
                {
                    if(s[++j]==s[++k]){
                        next1[j]=next1[k];
                    }else{
                        System.out.println("j:"+j);
                        System.out.println("k:"+k);
                        next1[j]=k;
                    }
                }else{//s[j]==s[k]和k==-1,都不满足,则往更深以层次比较next(k)
                    //此时s[j]!=s[k]
                    k=next1[k];//取k结束的串的最长匹配子串
                }
            }
            return next1;
        }
    public static void main(String[] args){
        Scanner sc=new Scanner(System.in);
        System.out.println("请输入主串:");
        String p=sc.nextLine();
        System.out.println("请输入子串:");
        String s=sc.nextLine();
        int i=km(p,s);//静态的方法main()只能调用静态的方法b(),因为静态方法早于对象而创建,
        //调用非静态方法时要提前创建对象,非静态方法要等对象创建之后才能被创建
        System.out.println("子串在主串中的位置:"+i);
    }
}结果:

请输入主串:
ababcabdabcabca
请输入子串:
abcabc
j:1
k:0
j:2
k:0
-1 0 0 -1 0 0 子串在主串中的位置:8

原文地址:https://www.cnblogs.com/xleer/p/5321276.html