Digester解析xml文件

一般用来读取xml文件的工具包有DOM、SAX和JDOM等，但用过的人都知道，它们属于比较底层的API，写起来代码量很大，而且如果修改了xml文件的格式，代码也要做大幅度的改动。而使用Apache Jakarta的Digester，解析XML文件非常方便且不需要过多的关心底层的具体解析过程。Digester本来仅仅是Jakarta Struts中的一个工具，用于处理struts-config.xml配置文件。显然，将XML文件转换成相应的Java对象是一项很通用的功能，这个工具理应具有更广泛的用途，所以很快它就在Jakarta Commons项目(用于提供可重用的Java组件库)中有了一席之地。Digester由"事件"驱动，通过调用预定义的规则操作对象栈，将XML文件转换为Java对象。

工作原理如下: Digester底层采用SAX(Simple API for XML)析XML文件，所以很自然的，对象转换由"事件"驱动，在遍历每个节点时，检查是否有匹配模式，如果有，则执行规则定义的操作，比如创建特定的Java对象，或调用特定对象的方法等。此处的XML元素根据匹配模式(matching pattern)识别，而相关操作由规则(rule)定义。

1.addObjectCreate(String rule,Class class)

设置节点与Java对象的映射规则，rule指定节点的筛选规则，class设置映射对象。SAX解析时，遇到rule指定的节节点，会创建一个class实例放入堆栈中。

比如：digester.addObectCreate("database/user","com.model.UserBean").解析遇到user节点时，会创建一个UserBean实例并放入堆栈中。

2.addSetProperties(String rule)

设置节点的属性设置规则。当解析遇到符合rule的节点时，根据属性列表中的属性值对，使用Java反射机制使用标准的JavaBean方法设置栈顶对象实例；

比如：digester.addSetProperties("database/user"),解析遇到user节点时，会获取键值对 userName=guest,password=guest，获得栈顶的UserBean对象，设置实例的userName、password属性；

3.addBeanPropertySetter(String rule)

该方法的作用及使用方法类似于addSetProperties，只不过它是用rule所指定的标签来调用对象的setter。

4.addSetNext(String rule,String methodName)

设置当前rule节点与父节点的调用规则，当遇到rule节点时，调用堆栈中的次栈顶元素调用methodName方法。将栈顶元素作为次顶元素指定方法的输入参数。

比如:digester.addSetNext("database/user","addUser"),调用database实例的addUser，user为参数

5.addCallMethod(String rule,String methodName,int paraNumber)

该方法同样设置对象的属性，但更加灵活，不需要对象具有setter

根据rule规则指定的属性，调用对象的methodName方法，paraNumber参数是表示方法需要的参数个数，当paraNumber=0时，可以单独使用，不然需要配合addCallParam方法

比如:digester.addCallMethod("database/user/userName","setUserName",0), 参数为xml当前值;无参方法:digester.addCallMethod( "pattern", "methodName" );.

6.addCallParam(String rule,int paraIndex,String attributeName)

该方法与addCallMethod配合使用，根据rule指定的标签属性来调用方法

paraIndex表明需要填充的方法形参序号，从0开始，方法由addCallMethdo指定，attributeName指定标签属性名；

使用注意事项:
   1.Digester类调用的顺序,必须与XML数据文件绝对一致;
   2.Digester类依赖于JavaBean规范,类必须符合规范;
   3.XML文件中标签/属性的名称必须与Bean中的一致(包括大小写);

//--webconfig.xml--
<?xml version="1.0" encoding="UTF-8"?>
<web>
<root name = "root_name1">
<bar id="0" title="The Zero Child"/>
<bar id="123" title="The First Child"/>
<bar id="456" title="The Second Child"/>
</root>
<root name = "root_name2">
<bar id="789" title="Another Child"/>
</root>
</web>

Digest
Digester digester = new Digester();	新建一个类
digester.setValidating(false);	是否进行XML与相应的DTD的合法性验证（此处为false）
digester.addObjectCreate("root", "Root");	当遇到<root>时创建一个Root对象，并将其放在栈顶
digester.addSetProperties("root");	根据<root>元素的属性(attribute)，对刚创建的Root对象的属性(property)进行设置
digester.addObjectCreate("root/bar", "Bar");	当遇到<root>的子元素<bar>时创建一个Bar对象，并将其放在栈顶。
digester.addSetProperties("root/bar");	根据<bar>元素的属性(attribute)，对刚创建的Bar对象的属性(property)进行设置
digester.addSetNext("root/bar", "addBar", "Bar");	当再次遇到<root>的子元素<bar>时创建一个Bar对象，并将其放在栈顶，同时调用第二栈顶元素(Root对象)的addBar方法。
digester.parse();	进行解析，得到的是Object

　如下xml代码，右边是左边元素对应的匹配模式：

[xhtml] view plain copy

<datasources> 'datasources'
<datasource> 'datasources/datasource'
<name/> 'datasources/datasource/name'
<driver/> 'datasources/datasource/driver'
</datasource>
<datasource> 'datasources/datasource'
<name/> 'datasources/datasource/name'
<driver/> 'datasources/datasource/driver'
</datasource>
</datasources>

例子1：

下面介绍解析xml文件的代码

下面是存放地址及编码的xml文件viewcache.xml(片段)：

[xhtml] view plain copy

<?xml version="1.0" encoding="UTF-8" ?>
<viewcache>
<areas>
<area>
<id>1098</id>
<parentId>1001</parentId>
<areaType>province</areaType>
<name>北京</name>
<ordering>1867</ordering>
</area>
<area>
<id>1099</id>
<parentId>1098</parentId>
<areaType>capital</areaType>
<name>北京</name>
<ordering>1868</ordering>
<phoneArea>010</phoneArea>
</area>
<area>
<id>4476</id>
<parentId>1099</parentId>
<areaType>county</areaType>
<name>北京市朝阳区</name>
<ordering>1869</ordering>
<phoneArea>010</phoneArea>
</area>
<area>
<id>4477</id>
<parentId>1099</parentId>
<areaType>county</areaType>
<name>北京市崇文区</name>
<ordering>1870</ordering>
<phoneArea>010</phoneArea>
</area>
<area>
<id>4478</id>
<parentId>1099</parentId>
<areaType>county</areaType>
<name>北京市大兴区</name>
<ordering>1871</ordering>
<phoneArea>010</phoneArea>
</area>
</areas>
</viewcache>

此xml文件分3层结构，分别为：

<viewcache>节点其下包含1个<areas>节点

<areas>节点其下包含多个<area>节点

<area>节点，其下包含各种信息节点：如：<id> 、<name>等。

我们的操作目标是把area中的信息节点的内容提取出来。
把每个<arrea>看做为一个对象，<area>中信息节点的内容为对象中的元素。
设定一个类Area.java 其内容如下：

[java] view plain copy

public class Area {
private int id;
private String name;
private String areaType;
private int parentId;
private int ordering;
private String zip;
private String phoneArea;
public int getOrdering() {
return ordering;
}
public void setOrdering(int ordering) {
this.ordering = ordering;
}
public String getAreaType() {
return areaType;
}
public void setAreaType(String areaType) {
this.areaType = areaType;
}
public int getId() {
return id;
}
public void setId(int id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getParentId() {
return parentId;
}
public void setParentId(int parentId) {
this.parentId = parentId;
}
public String getZip() {
return zip;
}
public void setZip(String zip) {
this.zip = zip;
}
public String getPhoneArea() {
return phoneArea;
}
public void setPhoneArea(String phoneArea) {
this.phoneArea = phoneArea;
}
}

创建一个ViewCache类，用来保存解析后的所有对象：

[java] view plain copy

public class ViewCache {
private List areaList = new ArrayList();
public List getAreaList() {
return areaList;
}
public void setAreaList(List areaList) {
this.areaList = areaList;
}
// 供Digester调用的方法
public void addArea(Area area) {
this.areaList.add(area);
}
}

创建一个类AreaDigester，对xml文件进行解析：

[java] view plain copy

public class AreaDigester {
public ViewCache digester() throws Exception {
Digester digester = new Digester();
digester.setValidating(false);
　　//addObjectCreate：当碰到第一个参数的节点时创建类型为第二个参数的对象并压入栈中
digester.addObjectCreate("viewcache/areas", ViewCache.class);
// 指明匹配模式和要创建的类
digester.addObjectCreate("viewcache/areas/area", Area.class);
// 设置对象属性,与xml文件对应,不设置则是默认
　　////addBeanPropertySetter：当碰到第一个参数的节点时执行栈顶对象的第二个参数的setter方法，参数为该节点的内容
digester.addBeanPropertySetter("viewcache/areas/area/id", "id");
digester.addBeanPropertySetter("viewcache/areas/area/parentId", "parentId");
digester.addBeanPropertySetter("viewcache/areas/area/name", "name");
digester.addBeanPropertySetter("viewcache/areas/area/areaType", "areaType");
digester.addBeanPropertySetter("viewcache/areas/area/ordering", "ordering");
digester.addBeanPropertySetter("viewcache/areas/area/zip", "zip");
digester.addBeanPropertySetter("viewcache/areas/area/phoneArea", "phoneArea");
// 当移动到下一个标签中时的动作
　　////当碰到第一个参数节点的结束标志时弹出栈顶元素，执行新栈顶元素的第二个参数的方法，并将弹出的栈顶元素当作该方法的参数
digester.addSetNext("viewcache/areas/area", "addArea");
ViewCache vc = null;
try {
vc = (ViewCache) digester.parse("viewcache.xml");
} catch (IOException e) {
throw new Exception(e);
} catch (SAXException e) {
throw new Exception(e);
}
return vc;
}
}

调用AreaDigester的digester方法，即可把解析后的所有地址对象，存放在ViewCache的list中。

例子2：

要解析的xml文件books.xml如下：

[xhtml] view plain copy

<?xml version="1.0" encoding="UTF-8" ?>
<library name="alibaba图书馆">
<book title ="thinking in java" author="xxx">
<chapter>
<no>第一章</no>
<caption>第一章的标题</caption>
</chapter>
<chapter>
<no>第二章</no>
<caption>第二章的标题</caption>
</chapter>
</book>
<book title="effective java" author="yyy">
<chapter>
<no>第一章</no>
<caption>第一章的标题</caption>
</chapter>
</book>
</library>

Library类如下：

[java] view plain copy

public class Library {
private String name;
private List<Book> bookList = new ArrayList<Book>();
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public List<Book> getBookList() {
return bookList;
}
public void addBook(Book book) {
bookList.add(book);
}
}

Book类如下：

[java] view plain copy

public class Book {
private String title;
private String author;
private List<Chapter> chapters = new ArrayList<Chapter>();
/**
* 这个方法，用来演示xml的解析时用的另一种方式
* @param title
* @param author
*/
public void setBookInfo(String title, String author) {
this.title = title;
this.author = author;
}
public void addChapter(Chapter chapter) {
this.chapters.add(chapter);
}
public String getTitle() {
return title;
}
public void setTitle(String title) {
this.title = title;
}
public String getAuthor() {
return author;
}
public void setAuthor(String author) {
this.author = author;
}
public List<Chapter> getChapters() {
return chapters;
}
public void setChapters(List<Chapter> chapters) {
this.chapters = chapters;
}
}

Chapter类如下：

[java] view plain copy

public class Chapter {
private String no;
private String caption;
public String getNo() {
return no;
}
public void setNo(String no) {
this.no = no;
}
public String getCaption() {
return caption;
}
public void setCaption(String caption) {
this.caption = caption;
}
}

解析xml的类如下：

[java] view plain copy

public class MainTest {
/**
* @param args
*/
public static void main(String[] args) {
// 建立一个Digester对象
Digester digester = new Digester();
//指定它不要用DTD验证XML文档的合法性——这是因为我们没有为XML文档定义DTD
digester.setValidating(false);
// 从library标签开始解析,并新建一个Library对象做为根对象
digester.addObjectCreate("library", Library.class);
// 根据library标签属性值设置对象的属性,一次可以设置多个属性
digester.addSetProperties("library");
// 也可以用下面的方法，指定propertyName
// digester.addSetProperties("library", "name", "name");
// -----第1层元素开始
digester.addObjectCreate("library/book", Book.class);
//digester.addSetProperties("library/book");
// 可以用以下三条语句代替
digester.addCallMethod("library/book", "setBookInfo", 2);
digester.addCallParam("library/book", 0, "title");
digester.addCallParam("library/book", 1, "author");
/**
* addCallParam(String rule, int paraIndex,String attributeName)
* 该方法与addCallMethod配合使用
* int paraIndex:表明需要填充的方法形参序号,从 0 开始,方法由addCallMethod指定
* String attributeName:指定标签属性名称
*/
// -----第2层元素开始
digester.addObjectCreate("library/book/chapter", Chapter.class);
/** addBeanPropertySetter()是将子节点转换为对象的属性，这个方法还可以有第二个参数，当对象的属性名和子节点的名字不一样时用来指定对象的属性名
该方法的作用及使用方法类似于addSetProperties,只不过它是用String rule规则所指定标签的值(而不是标签的属性)来调用对象的setter*/
digester.addBeanPropertySetter("library/book/chapter/no");
// digester.addBeanPropertySetter("library/book/chapter/no", "no");
/** addCallMethod(String rule,String methodName, int paraNumber) 方法
* 同样是设置对象的属性,但是方式更加灵活,不需要对象具有setter
* 当paraNumber = 0时,可以单独使用(表明为标签的值来调用),不然需要配合addCallParam方法
*/
// digester.addBeanPropertySetter("library/book/chapter/caption");
// 下面的方法，可以用来代替上一句，作用是一样的
digester.addCallMethod("library/book/chapter/caption", "setCaption", 0);
// addSetNext()是说在再次遇到匹配节点后，调用当前对象(Chapter类的对象)的父对象(Book类的对象)的方法，方法参数是当前层元素的对象
digester.addSetNext("library/book/chapter", "addChapter");
// -----第2层元素结束
digester.addSetNext("library/book", "addBook");
// -----第1层元素结束
try {
// 解析XML文件,并得到ROOT元素
Library library = (Library) digester.parse(MainTest.class.getResourceAsStream("books.xml"));
System.out.println(" 图书馆: " + library.getName());
System.out.println(" 共藏书: " + library.getBookList().size() + " 本 ");
System.out.println(" ***************************** ");
for (Book book : library.getBookList()) {
System.out.println(" 书名: " + book.getTitle() + " 作者: " + book.getAuthor());
System.out.println(" ------------------------------ ");
// 显示章节
System.out.println(" 共 " + book.getChapters().size() + " 章 ");
for (Chapter chapter : book.getChapters()) {
System.out.println(chapter.getNo() + ": " + chapter.getCaption());
}
System.out.println(" ------------------------------ ");
}
} catch (IOException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
}
}
}

例子3：

Digester解析xml的规则，除了在java类中描述设置之外，还可以把解析规则放在xml文件中。以例子2中的代码为例，规则在books-rule.xml文件中，内容如下：(The DTD is distributed in the commons-digester.jar. It can be found at org/apache/commons/digester/xmlrules/digester-rules.dtd，通过查看DTD文件，可以知道有哪些标签可以使用)

[xhtml] view plain copy

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE digester-rules PUBLIC
"-//Jakarta Apache //DTD digester-rules XML V1.0//EN"
"digester-rules.dtd">
<digester-rules>
<object-create-rule pattern="library" classname="com.alibaba.chj.digester.Library" />
<set-properties-rule pattern="library">
<alias attr-name="name" prop-name="name" />
</set-properties-rule>
<pattern value="library/book">
<object-create-rule classname="com.alibaba.chj.digester.Book" />
<set-properties-rule />
<pattern value="chapter">
<object-create-rule classname="com.alibaba.chj.digester.Chapter" />
<bean-property-setter-rule pattern="no" propertyname="no" />
<bean-property-setter-rule pattern="caption" propertyname="caption" />
<set-next-rule methodname="addChapter" />
</pattern>
<set-next-rule methodname="addBook" />
</pattern>
</digester-rules>

解析xml类的代码，修改为：

[java] view plain copy

public class MainTest {
/**
* @param args
*/
public static void main(String[] args) {
try {
Digester digester = DigesterLoader.createDigester(DigesterXmlRuleTest.class.getResource("books-rule.xml"));
Library library = (Library) digester.parse(DigesterXmlRuleTest.class.getResourceAsStream("books.xml"));
System.out.println(" 图书馆: " + library.getName());
System.out.println(" 共藏书: " + library.getBookList().size() + " 本 ");
System.out.println(" ***************************** ");
for (Book book : library.getBookList()) {
System.out.println(" 书名: " + book.getTitle() + " 作者: " + book.getAuthor());
System.out.println(" ------------------------------ ");
// 显示章节
System.out.println(" 共 " + book.getChapters().size() + " 章 ");
for (Chapter chapter : book.getChapters()) {
System.out.println(chapter.getNo() + ": " + chapter.getCaption());
}
System.out.println(" ------------------------------ ");
}
} catch (IOException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
}
}
}

用于规则放在xml文件中，所以解析的类，显得更加简洁一些。