XML—代码—DOM4J解析

XML—代码—DOM4J解析

众所周知，xml常用语数据存储和传输，文件后缀为 .xml；

它是可扩展标记语言（Extensible Markup Language，简称XML），是一种标记语言。

如何定义这些标记，既可以选择国际通用的标记语言如HTML，也可以使用像XML这样由相关人士自由决定的标记语言，这就是语言的可扩展性。XML设计用来传送及携带数据信息，不用来表现或展示数据，所以XML用途的焦点是它说明数据是什么，以及携带数据信息。而HTML语言则用来表现数据。可扩展标记语言，标准通用标记语言的子集，是一种用于标记电子文件使其具有结构性的标记语言。在电子计算机中，标记指计算机所能理解的信息符号，通过此种标记，计算机之间可以处理包含各种的信息比如文章等。它可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。它非常适合万维网传输，提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。是Internet环境中跨平台的、依赖于内容的技术，也是当今处理分布式结构信息的有效工具。早在1998年，W3C就发布了XML1.0规范，使用它来简化Internet的文档信息传输。

通过DOM4J API和标准DOM接口具有并行访问功能,DOM4J使用接口和抽象基本类方法。DOM4J大量使用了API中的Collections类，例如大名鼎鼎的hibernate也用DOM4J来读取XML配置文件。如果不考虑可移植性，那就采用DOM4J.

-------------------------------------------------

DOM解析用例：

--------------------------------------------------

public class DOMforEm {

public static ArrayList<Employee> showEM() throws ParserConfigurationException, IOException, Exception{

ArrayList<Employee> list = new ArrayList<Employee>();

//1.得到DOM解析器的工厂实例

DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

//2从工厂中获得DOM解析器

DocumentBuilder db = dbf.newDocumentBuilder();

//3把XML倒挂为一颗DOM树

Document doc = db.parse("employee.xml");

//4拿到节点集合

NodeList emList =doc.getElementsByTagName("em");

//5.遍历DOM树，循环节点信息

for(int i=0;i<emList.getLength();i++){

Employee emClass = new Employee();

//6.强转子节点为元素

Element em =(Element)emList.item(i);

//7.取得元素的属性值

String attrValue = em.getAttribute("id");

emClass.setNo(Integer.parseInt(attrValue));

//8循环每一个元素的子节点

NodeList em2List = em.getChildNodes();

for(int j=0;j<em2List.getLength();j++){

Node item = em2List.item(j);

//子节点不用强转

int type = item.getNodeType();

String content = item.getTextContent();

String name = item.getNodeName();

if(name != null && name.equals("emname")){

emClass.setName(content);

}else if(name!= null && name.equals("job")){

emClass.setJob(content);

emClass.setSalary(content);

list.add(emClass);

public static void main(String[] args) {

ArrayList<Employee> list = showEM();

for (int i = 0; i < list.size(); i++) {

System.out.println(list.get(i));

} catch (Exception e) {

e.printStackTrace();

--------------------------------------------------

DOM4J解析xml整理

xml解析异常1：

java.io.UTFDataFormatException: Invalid byte 2 of 2-byte UTF-8 sequence.

异常分析：

由于声明的Xml是UTF-8编码的，而转换的时候使用默认的编码是gbk的

===============================

xml解析异常2：

The processing instruction target matching "[xX][mM][lL]" is not allowed. activity_main.xml

异常分析：

XML头信息写在最前面，

<?xml version="1.0" encoding="UTF-8"?> 前面不能有空格

====================================

加载xml文件：

==================

加载String类型的报文：

Document document = DocumentHelper.parseText(xmlResult);====

===================================

加载xml文件：

Document doc = null;

* DOM4J加载xml文件

public void LoadXML(String path){

SAXReader saxReader= new SAXReader();

//read()的入参可以是File,InputStream,Reader,URL等多种方式....，用字节流加载防止中文乱码，很重要

doc = saxReader.read(path);

} catch (Exception e) {

e.printStackTrace();

=============================================

* 保存XML文件

public void saveXML(String path){

OutputFormat format = OutputFormat.createPrettyPrint();

format.setEncoding("UTF-8");

XMLWriter writer = new XMLWriter(new FileWriter(path), format);

writer.write(doc);

writer.flush();

writer.close();

} catch (Exception e) {

e.printStackTrace();

=========================================

doc.asXML方法

将doc对象转化成xmlstring的格式，并可以将string打印出来。

拿到根节点对象

Element root =doc.getRootElement();

拿根节点对象： Element rootElem = document.getRootElement();

获取某节点的单个子节点：Element memberElem = root.element("节点名");

获取根节点下的所有的名为name子节点的集合并遍历：(遍历之前先判断有无子节点)

List nodes= root.elements("name");

for(Iterator it = nodes.iterator() ; it.hasNext() ; ){

Element elm = (Element) it.next();

对某节点下所有的子节点进行遍历：

for(Iterator it = root.elementIterator() ; it.hasNext() ; ){

Element elm = (Element) it.next();

添加age子节点：

Element ageELm = newMenberElm.addElement("age");

删除子节点：

parentElm.remove(chaildElm);

Element.getParent().remove(Element);

==========================================

拿节点的内容1：

Element.getTextTrim()【忽略换行键】

Element.getText()【包含换行键】

若有子节点，则得到的String为空串""，遍历之前先判断否则空指针异常，例：

String text = root.getTextTrim();

if (!text.equals("")) {

System.out.println("根节点的内容是："+text);

Iterator<Element> item = root.elementIterator();

int ii=1;//3遍历所有的元素

while(item.hasNext()){

获取根节点下的name子节点的内容2：

String text = root.elementText("name");

设置/修改节点的内容：Element.setText("内容");

拿节点的名字：Element.getName()

修改节点的名字：Element.setName() ================================================

获取某节点下的某属性（对象）：

Atrribute attribute = root.attribute("size");

继而获取属性对象的值：

String text = attribute .getText();

也可以从节点对象取属性对象的值2：

Element.attributeValue("size");

遍历某节点的所有属性：

for(Iterator it = root.attributeIterator() ; it.hasNext() ; ){

Atrribute attribute = it.next()；

String text = attribute .getText();

删除某属性：

Atrribute attribute = root.attribute("size");

root.remove(attribute)；

//root.remove(root.attribute("size"))；

添加节点属性 Element.addAttribute("language", "java");如果重复添加则覆盖，可当做修改操作

修改节点的值：Element.setText("值");

===============================================

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/domi22/p/8046752.html