解析xml文件的方式

 解析xml文件的方式有四种:DOM , SAX, JDOM, DOM4J。

1.DOM: 处理大型文件时其性能下降的非常厉害。这个问题是由DOM的树结构所造成的,这种结构占用的内存较多,而且DOM必须在解析文件之前把整个文档装入内存,适合对XML的随机访问。

简单代码如下:

  File f=new File("data_10k.xml");

 DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

 DocumentBuilder builder = factory.newDocumentBuilder();

 Document doc = builder.parse(f);

 NodeList nl = doc.getElementsByTagName("VALUE");

 for (int i=0;i<nl.getLength();i++){

  System.out.print( doc.getElementsByTagName("NO").item(i).getFirstChild().get NodeValue());

  }

2.SAX: 不同于DOM,SAX是事件驱动型的XML解析方式。它顺序读取XML文件,不需要一次全部装载整个文件。当遇到像文件开头,文档结束,或者标签开头与标签结束时,它会触发一个事件,用户通过在其回调事件中写入处理代码来处理XML文件,适合对XML的顺序访问。

简单代码如下:

  SAXParserFactory sf = SAXParserFactory.newInstance();

 SAXParser sp = sf.newSAXParser();

 MyXMLReader reader = new MyXMLReader();

 sp.parse(new InputSource("data_10k.xml"), reader);

3.JDOM:目的是成为Java特定文档模型,它简化与XML的交互并且比使用DOM实现更快。JDOM仅使用具体类而不使用接口。这在某些方面简化了API,但是也限制了灵活性。第二,API大量使用了Collections类,简化了那些已经熟悉这些类的Java开发者的使用;它自身不包含解析器,它通常使用SAX2解析器来解析和验证输入XML文档。

简单代码如下:

  SAXBuilder builder = new SAXBuilder();

 Document doc = builder.build(new File("data_10k.xml"));

 Element foo = doc.getRootElement();

 List allChildren = foo.getChildren();

 for(int i=0;i<allChildren.size();i++) {

 System.out.println( ((Element)allChildren.get(i)).getChild("NO").getText());

  }

4.DOM4J:代表了完全独立的开发结果,但最初,它是JDOM的一种智能分支。它合并了许多超出基本XML文档表示的功能,包括集成的XPath支持、XML Schema支持以及用于大文档或流化文档的基于事件的处理。它还提供了构建文档表示的选项,它通过DOM4J API和标准DOM接口具有并行访问功能。它是一个非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一个开放源代码的软件。如今越来越多的Java软件都在使用DOM4J来读写XML,特别值得一提的是连Sun的JAXM也在用DOM4J。

简单代码如下:

  File f = new File("data_10k.xml");

 SAXReader reader = new SAXReader();

 Document doc = reader.read(f);

 Element root = doc.getRootElement();

 Element foo;

  Iterator i = root.elementIterator("VALUE");

 for (i.hasNext() {

  foo = (Element) i.next();

   ......}

原文地址:https://www.cnblogs.com/huangcc/p/2520652.html