解析xml文件的方式

解析xml文件的方式有四种：DOM , SAX, JDOM, DOM4J。

1.DOM: 处理大型文件时其性能下降的非常厉害。这个问题是由DOM的树结构所造成的，这种结构占用的内存较多，而且DOM必须在解析文件之前把整个文档装入内存,适合对XML的随机访问。

简单代码如下：

File f=new File("data_10k.xml");

　DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

　DocumentBuilder builder = factory.newDocumentBuilder();

　Document doc = builder.parse(f);

　NodeList nl = doc.getElementsByTagName("VALUE");

　for (int i=0;i＜nl.getLength();i++){

System.out.print( doc.getElementsByTagName("NO").item(i).getFirstChild().get NodeValue());

}

2.SAX: 不同于DOM,SAX是事件驱动型的XML解析方式。它顺序读取XML文件，不需要一次全部装载整个文件。当遇到像文件开头，文档结束，或者标签开头与标签结束时，它会触发一个事件，用户通过在其回调事件中写入处理代码来处理XML文件，适合对XML的顺序访问。

简单代码如下：

SAXParserFactory sf = SAXParserFactory.newInstance();

　SAXParser sp = sf.newSAXParser();

　MyXMLReader reader = new MyXMLReader();

　sp.parse(new InputSource("data_10k.xml"), reader);

3.JDOM：目的是成为Java特定文档模型，它简化与XML的交互并且比使用DOM实现更快。JDOM仅使用具体类而不使用接口。这在某些方面简化了API，但是也限制了灵活性。第二，API大量使用了Collections类，简化了那些已经熟悉这些类的Java开发者的使用；它自身不包含解析器，它通常使用SAX2解析器来解析和验证输入XML文档。

简单代码如下：

SAXBuilder builder = new SAXBuilder();

　Document doc = builder.build(new File("data_10k.xml"));

　Element foo = doc.getRootElement();

　List allChildren = foo.getChildren();

　for(int i=0;i＜allChildren.size();i++) {

　System.out.println( ((Element)allChildren.get(i)).getChild("NO").getText());

}

4.DOM4J：代表了完全独立的开发结果，但最初，它是JDOM的一种智能分支。它合并了许多超出基本XML文档表示的功能，包括集成的XPath支持、XML Schema支持以及用于大文档或流化文档的基于事件的处理。它还提供了构建文档表示的选项，它通过DOM4J API和标准DOM接口具有并行访问功能。它是一个非常优秀的Java XML API，具有性能优异、功能强大和极端易用使用的特点，同时它也是一个开放源代码的软件。如今越来越多的Java软件都在使用DOM4J来读写XML，特别值得一提的是连Sun的JAXM也在用DOM4J。

简单代码如下：

File f = new File("data_10k.xml");

　SAXReader reader = new SAXReader();

　Document doc = reader.read(f);

　Element root = doc.getRootElement();

　Element foo;

Iterator i = root.elementIterator("VALUE");

　for (i.hasNext() {

foo = (Element) i.next();

......}