XML 8—— SAX

  • SAX(Simple APls for XML),面向XML的简单APls。
  • 使用DOM解析XML时,首先将XML文档加载到内存当中,然后可以通过随机的方式访问内存中的 DOM树;SAX是基于事件而且是顺序执行的,一旦经过了某个元素,我们就没有办法再去访问它了,SAX不必实现将整个XML文档加载到内存当中,因此它占据内存要比DOM小,对于大型的XML文档来说,通常会使用SAX而不是 DOM进行解析。
  • SAX也是使用的观察者模式(类似于GU中的事件)。

SAX的全称是simple APIs for XML,也即XML简单应用程序接口。与DOM不同,SAX提供的访问模式是一种顺序模式,这是一种快速读写xMm数据的方式。当使用SAX分析器对XML文档进行分析时,会触发一系列事件,并激活相应的事件处理函数,应用程序通过这些事件处理函数实现对ML文档的访问,因而sAX接口也被称作事件驱动接口。

SAX分析器在对XML文档进行分析时,触发了一系列的事件,由于事件触发本身是有时序性的,因此,SAX提供的是一种顺序访问机制,对于已经分析过的部分,不能再倒回去重新处理。SAX之所以被叫做"简单"应用程序接口,是因为SAX分析器只做了一些简单的工作,大部分工作还要由应用程序自己去做。也就是说,SAX分析器在实现时,它只是顺序地检查XML文档中的字节流,判断当前字节是XML语法中的哪一部分、是否符合XML语法,然后再触发相应的事件,而事件处理函数本身则要由应用程序自己来实现。同DOM分析器相比,SAX分析器缺乏灵活性。然而,由于SAX分析器实现简单,对内存要求比较低,因此实现效率比较高,对于那些只需要访问XML文档中的数据而不对文档进行更改的应用程序来说,SAX分析器更为合适。

SAX分析器的大体构成框架

图中最上方的SAXParserFactory用来生成一个分析器实例。将文档从左侧箭头所示处读入,当分析器对文档进行分析时,就会触发在DocumentHandler、ErrorHandler、DTDHandler以及EntityResolver接口中定义的回调方法。

  • SAX是事件驱动的,文档的读入过程就是SAX的解析过程。
  • 在读入的过程中,遇到不同的项目,解析器会调用不同的处理方法。

saxtest.java
package DOMTEST;

import java.io.File;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.helpers.DefaultHandler;

public class saxtest {
    public static void main(String[] args) throws Exception{
        // step1:获取SAX解析器工厂实例
        SAXParserFactory factory = SAXParserFactory.newNSInstance();
        
        // step2:获取SAX解析器实例
        SAXParser parser = factory.newSAXParser();
        
        // step3:开始进行解析
        parser.parse(new File("DomTest2.xml"), new MyHandler());
        
    }
}

class MyHandler extends DefaultHandler{
    
    @Override
    public void startDocument() {
        System.out.println("parse begin");
    }
    
    @Override
    public void endDocument() {
        System.out.println("parse end");
    }
    
    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) {
        System.out.println("start element");
    }
    
    @Override
    public void endElement (String uri, String localName,String qName){
        System.out.println("finish element");
    }

}

saxtest2.java
package DOMTEST;

import java.io.File;
import java.util.Stack;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class saxtest2 {
    public static void main(String[] args) throws Exception {
        SAXParserFactory factory = SAXParserFactory.newNSInstance();
        SAXParser parser = factory.newSAXParser();
        parser.parse(new File("DomTest2.xml"), new MyHandler2());
    }

    public static class MyHandler2 extends DefaultHandler {
        private Stack<String> stack = new Stack<String>();
        String Cpp;
        String CoreJava;
        String Javaweb;
        String EJB;

        @Override
        public void startElement(String uri, String localName, String qName, Attributes attributes)
                throws SAXException {
            stack.push(qName);
            for (int i = 0; i < attributes.getLength(); i++) {
                String attrName = attributes.getQName(i);
                String attrvalue = attributes.getValue(i);
                System.out.println(attrName + "=" + attrvalue);
            }

        }

        @Override
        public void characters(char[] ch, int start, int length) throws SAXException {
            String tag = stack.peek();
            if ("Cpp".equals(tag)) {
                Cpp = new String(ch, start, length);
            } else if ("CoreJava".equals(tag)) {
                CoreJava = new String(ch, start, length);
            } else if ("Javaweb".equals(tag)) {
                Javaweb = new String(ch, start, length);
            } else if ("EJB".equals(tag)) {
                EJB = new String(ch, start, length);
            }
        }

        @Override
        public void endElement(String uri, String localName, String qName) throws SAXException {
            stack.pop();// 表示该元素已经解析完毕,需要从栈中弹出
            if ("Student".equals(qName)) {
                System.out.println("Cpp: " + Cpp);
                System.out.println("CoreJava: " + CoreJava);
                System.out.println("Javaweb: " + Javaweb);
                System.out.println("EJB: " + EJB);
                System.out.println();
            }
        }
    }
}

 

转载请注明出处:https://www.cnblogs.com/stu-jyj3621
原文地址:https://www.cnblogs.com/stu-jyj3621/p/14341455.html