dom4j的解析实例

book.xml数据如下：

[html] view plain copy

<books>
<book>
<author>Thomas</author>
<title>Java从入门到放弃</title>
<publisher>UCCU</publisher>
</book>
<book>
<author>小白</author>
<title>MySQL从删库到跑路</title>
<publisher>Go Die</publisher>
</book>
<book>
<author>PHPer</author>
<title>Best PHP</title>
<publisher>PHPchurch</publisher>
</book>
</books>

我把book.xml放在D盘的根目录下，这样读取时能比较方便些……

下面是代码：

[java] view plain copy

package com;
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import java.io.ByteArrayInputStream;
import java.io.File;
import java.util.List;
public class SAXReaderXML {
public static void main(String[] args) throws Exception {
SAXReader reader = new SAXReader();
File xmlfile = new File("D:/books.xml");
String xml = "<books><book><author>Thomas</author><title>Java从入门到放弃</title><publisher>UCCU</publisher>" +
"</book><book><author>小白</author><title>MySQL从删库到跑路</title><publisher>GoDie</publisher></book>" +
"<book><author>PHPer</author><title>BestPHP</title><publisher>PHPchurch</publisher></book></books>";
Document fileDocument = reader.read(xmlfile);//从xml文件获取数据
Document document = reader.read(new ByteArrayInputStream(xml.getBytes("utf-8")));//读取xml字符串，注意这里要转成输入流
Element root = document.getRootElement();//获取根元素
List<Element> childElements = root.elements();//获取当前元素下的全部子元素
for (Element child : childElements) {//循环输出全部book的相关信息
List<Element> books = child.elements();
for (Element book : books) {
String name = book.getName();//获取当前元素名
String text = book.getText();//获取当前元素值
System.out.println(name + ":" + text);
}
}
//获取第二条书籍的信息
Element book2 = childElements.get(1);
Element author = book2.element("author");//根据元素名获取子元素
Element title = book2.element("title");
Element publisher = book2.element("publisher");
System.out.println("作者：" + author.getText());//获取元素值
System.out.println("书名：" + title.getText());
System.out.println("出版社："+publisher.getText());
}
}

代码解析：

1、读取xml数据

SAXReader可以通过多种方式读取xml数据，并返回Document格式的对象。通过查看源码，可以看出read()方法接收File，InputStream和URL等格式的参数来读取相应的xml数据。在代码里我演示了读取xml文档和xml格式的字符串两种方式。当然，字符串要根据相应的编码转成输入流才能被SAXReader读取。

2、解析xml数据

读取到Document对象后，我们使用getRootElement()方法获取根元素，返回的是一个Element对象。在本例中，该元素的name即为books。

3、获取子元素数据

获取根元素后，便可以一层一层的去获取他的子元素信息。如果知道子元素的标签名称，便可以直接调用element("name")方法获取该子元素。如果不知道子元素的名称，或者想直接获取该元素下的全部子元素，可以调用elements()方法获取一个包括全部元素的list，然后进行下一步的处理。

4、输出元素信息

调用getName()方法获取当前元素的元素名，attributeValue()获取属性名。如果当前元素没有子元素，则调用getText()方法获取元素值。