Android XML数据解析

XML：可扩展标记语言。一般用于数据存储，SharedPreference就是使用xml文件保存信息的，SQLite底层也是xml文件，在网络方面通常作为信息的载体，把数据包装成xml来传递。

XML解析方式：SAX、DOM、PULL。

SAX解析XML数据

　　SAX解析速度快，占用内存少，非常适合Android等移动设备。SAX解析采用的是事件驱动，不需要解析整个文档，而是在解析过程中，判断读到的字符是否符合xml语法的某个部分（文档开始、结束，标签开始、结束），符合则出触发事件（回调方法），这些方法定义在ContentHandler接口中，为便于使用Android提供了一个DefaultHandler帮助类，只要继承这个类，重写相应的方法即可。

　　重写的方法：

　　　　startDocument（）：文档开始时触发，做初始化工作。

　　　　endDocument（）：文档结束时触发，完成善后工作。

　　　　startElement（）：元素开始时触发。

　　　　endElement（）：元素结束时触发。　　

　　　　characters（ch，start，length）：处理在xml中读到的内容，ch存放文件内容、start和length读到内容在数组中的起始位置和长度。使用new String（ch，start，length）可以获取内容。

　　核心代码

public class SaxHelper extends DefaultHandler {
    private Person person;
    private ArrayList<Person> persons;

    //当前解析的元素标签
    private String tagName = null;

    /**
     * 当读取到文档开始标志是触发，通常在这里完成一些初始化操作
     * @throws SAXException
     */
    @Override
    public void startDocument() throws SAXException {
        this.persons = new ArrayList<Person>();
        Log.i("SAX", "读取到文档头,开始解析xml");

    }

    /**
     * 读到一个开始标签时调用,第二个参数为标签名,最后一个参数为属性数组
     * @param uri
     * @param localName
     * @param qName
     * @param attributes
     * @throws SAXException
     */
    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws   SAXException {
        if (localName.equals("person")){
            person = new Person();
            person.setId(Integer.parseInt(attributes.getValue("id")));
            Log.i("SAX", "开始处理person元素~");

        }
        this.tagName = localName;

    }

    /**
     * 读到到内容,第一个参数为字符串内容,后面依次为起始位置与长度
     * @param ch
     * @param start
     * @param length
     * @throws SAXException
     */
    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        //判断当前标签是否有效
        if (this.tagName != null){
            String data = new String(ch, start, length);

            //读取标签中的内容
            if (this.tagName.equals("name")){
                this.person.setName(data);
                Log.i("SAX", "处理name元素内容");

            }else if (this.tagName.equals("age")){
                this.person.setAge(Integer.parseInt(data));
                Log.i("SAX", "处理age元素内容");

            }

        }

    }

    /**
     * 处理元素结束时触发,这里将对象添加到结合中
     * @param uri
     * @param localName
     * @param qName
     * @throws SAXException
     */
    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        if (localName.equals("person")){
            this.persons.add(person);
            person = null;
            Log.i("SAX", "处理person元素结束~");

        }
        this.tagName = null;

    }

    /**
     * 读取到文档结尾时触发，
     * @throws SAXException
     */
    @Override
    public void endDocument() throws SAXException {
        super.endDocument();
        Log.i("SAX", "读取到文档尾,xml解析结束");
    }

    //获取persons集合
    public ArrayList<Person> getPersons(){
        return  persons;
    }

}

在MainActivity.java中写上这样一个方法，然后要解析XML的时候调用下

private ArrayList<Person> readxmlForSAX() throws Exception { 

      //获取文件资源建立输入流对象
      InputStream is = getAssets().open("person1.xml");

     //①创建XML解析处理器 
      SaxHelper ss = new SaxHelper(); 

      //②得到SAX解析工厂 
      SAXParserFactory factory = SAXParserFactory.newInstance();

      //③创建SAX解析器 
      SAXParser parser = factory.newSAXParser(); 

      //④将xml解析处理器分配给解析器,对文档进行解析,将事件发送给处理器 
          parser.parse(is, ss);

         is.close();
         return ss.getPersons();
}

DOM解析XML数据

　　DOM解析xml文件时，会将文件中所有内容以文档树的形式存放到内存中，然后使用DOM API遍历、检索数据。DOM解析比较直观，编码较为简单，但是内存消耗大。

　　DOM中的api：

　　　　DocumentBuilderFactory（）（解析工厂类）：创建：DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance（）；

　　　　DocumentBuilder（解析器类）：通过解析工厂来获得：DocumentBuilder dbBuilder = dbFactory.newDocumentBuilder（）；

　　　　Document（文档树模型）：将要解析的xml文件读入DOM解析器Document doc = dbBuilder.parse（context.getAssets（）.open（"person2.xml"））；

　　　　NodeList（结点列表类）：含有方法：item（index）、getLength（）

　　　　Node（）（结点类）：DOM中最基本的对象，抽象结点，一般使用它的子对象，Element、Attr、Text等

　　　　Element（）（元素类）：方法：getAttribute（）、getTagName（）

　　　　Attr（）（属性类）：某个元素的属性。

　　核心代码

public class DomHelper {
    public static ArrayList<Person> queryXML(Context mContent){

    ArrayList<Person> persons = new ArrayList<Person>();

    try {
        //①获得DOM解析器的工厂示例:
        DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();

        //②从Dom工厂中获得dom解析器
        DocumentBuilder builder = dbFactory.newDocumentBuilder();

        //③把要解析的xml文件读入Dom解析器
        Document document = builder.parse(mContent.getAssets().open("person2.xml"));
        System.out.println("处理该文档的DomImplemention对象=" + document.getImplementation());

        //④得到文档中名称为person的元素的结点列表
        NodeList nodeList = document.getElementsByTagName("person");

        //⑤遍历该集合,显示集合中的元素以及子元素的名字
        for (int i = 0; i < nodeList.getLength(); i ++){
            //先从Person元素开始解析
            Element personElement = (Element)nodeList.item(i);
            Person person = new Person();
            person.setId(Integer.valueOf(personElement.getAttribute("id")));

            //获取person下的name和age的Note集合
            NodeList childList = personElement.getChildNodes();
            for (int j = 0; j < childList.getLength(); j ++){

                Node childNode = childList.item(j);

                //判断子note类型是否为元素Note
                if (childNode.getNodeType() == Node.ELEMENT_NODE){

                    Element childElement = (Element)childNode;

                    if ("name".equals(childElement.getNodeName())){
                        person.setName(childElement.getFirstChild().getNodeValue());

                    }else if("age".equals(childElement.getNodeName())){
                        person.setAge(Integer.valueOf(childElement.getFirstChild().getNodeValue()));

                    }

                }

            }
            persons.add(person);

        }

    } catch (Exception e) {
        e.printStackTrace();
    }
    return persons;

}

PULL解析XML数据

　　Android中内置了PULL解析器，PULL解析同样采用事件驱动，编码简单，只需处理开始和结束事件，通常使用switch语句，根据事件的类型，匹配不同的处理方法。

　　事件类型：START_DOCUMENT、START_TAG、TEXT、END_TAG、END_DOCUMENT。

　　PULL解析返回的是数字，需要我们自己获取产生的事件，然后做相应的操作。

　　PULL解析xml文件流程：　

public static ArrayList<Person> getPersons(InputStream xml) throws Exception{
　　ArrayList<Person> persons = null;
　　Person person = null;
　　// 1、创建一个xml解析的工厂
    XmlPullParserFactory factory = XmlPullParserFactory.newInstance();

    //2、获得xml解析类的引用
    XmlPullParser parser = factory.newPullParser();
    parser.setInput(xml, "UTF-8");

    //3、获得事件的类型
    int eventType = parser.getEventType();
　　//4、用switch对不同的事件进行不同的处理
    while (eventType != XmlPullParser.END_DOCUMENT){
        switch (eventType){
            case XmlPullParser.START_DOCUMENT:{
                persons = new ArrayList<Person>();
                break;

            }
            case XmlPullParser.START_TAG:{
                if ("person".equals(parser.getName())){
                    person = new Person();

                    // 取出属性值
                    int id = Integer.parseInt(parser.getAttributeValue(0));
                    person.setId(id);

                }else if("name".equals(parser.getName())){
                    // 获取该节点的内容
                    String name = parser.nextText();
                    person.setName(name);

                }else if("age".equals(parser.getName())){
                    int age = Integer.parseInt(parser.nextText());
                    person.setAge(age);

                }
                break;

            }
            case XmlPullParser.END_TAG:{
                if ("person".equals(parser.getName())){
                    persons.add(person);
                    person = null;

                }
                break;

            }

        }
        eventType = parser.next();


    }
    return persons;

}

PULL生成xml文件流程

public static void save(List<Person> persons, OutputStream outputStream) throws Exception{
　　//创建XmlSerializer实例
    XmlSerializer serializer = Xml.newSerializer();
　　//为XmlSerializer设置输入流和编码格式
    serializer.setOutput(outputStream, "UTF-8");
　　//设置xml的编码格式
    serializer.startDocument("UTF-8", true);
　　//设置根元素
    serializer.startTag(null, "persons");
　　//遍历元素依次写入标签和属性
    for (Person person: persons) {
        serializer.startTag(null, "person");
        serializer.attribute(null, "id", person.getId() + "");

        serializer.startTag(null, "name");
        serializer.text(person.getName());
        serializer.endTag(null, "name");

        serializer.startTag(null, "age");
        serializer.text(person.getAge() + "");
        serializer.endTag(null, "age");

　　　　//设置完结元素标签
        serializer.endTag(null, "person");

    }
    serializer.endTag(null, "persons");
　　//结束文档
    serializer.endDocument();
　　//flush（）刷新，将数据写入文件，关闭输出流
    outputStream.flush();
    outputStream.close();
}

参考文献：http://www.jianshu.com/p/2fe796ca638c