XML

六. XML 部分

1、xml 有哪些解析技术?区别是什么?

答:有DOM,SAX,STAX 等

DOM:处理大型文件时其性能下降的非常厉害。这个问题是由DOM 的树结构所造成的，这种结

构占用的内存较多，而且DOM 必须在解析文件之前把整个文档装入内存,适合对XML 的随机

访问SAX:不现于DOM,SAX 是事件驱动型的XML 解析方式。它顺序读取XML 文件，不需要

一次全部装载整个文件。当遇到像文件开头，文档结束，或者标签开头与标签结束时，它会触

发一个事件，用户通过在其回调事件中写入处理代码来处理XML 文件，适合对XML 的顺序访

问

STAX:Streaming API for XML (StAX)

讲解这些区别是不需要特别去比较，就像说传智播客与其他培训机构的区别时，我们只需说清

楚传智播客有什么特点和优点就行了，这就已经间接回答了彼此的区别。

2、你在项目中用到了xml 技术的哪些方面?如何实现的?

答:用到了数据存贮，信息配置两方面。在做数据交换平台时，将不能数据源的数据组装成XML

文件，然后将XML 文件压缩打包加密后通过网络传送给接收者，接收解密与解压缩后再同XML

文件中还原相关信息进行处理。在做软件配置时，利用XML 可以很方便的进行，软件的各种

配置参数都存贮在XML 文件中。

3、用jdom 解析xml 文件时如何解决中文问题?如何解析?

答:看如下代码,用编码方式加以解决

package test;

import java.io.*;

public class DOMTest

{

private String inFile = "c:\\people.xml"

private String outFile = "c:\\people.xml"

public static void main(String args[])

{

new DOMTest();

}

public DOMTest()

{ javax.xml.parsers.DocumentBuilder builder =

javax.xml.parsers.DocumentBuilderFactory.newInstance().newDocumentBuilder();

org.w3c.dom.Document doc = builder.newDocument();

org.w3c.dom.Element root = doc.createElement("老师");

org.w3c.dom.Element wang = doc.createElement("王");

org.w3c.dom.Element liu = doc.createElement("刘");

wang.appendChild(doc.createTextNode("我是王老师"));

root.appendChild(wang);

doc.appendChild(root);

javax.xml.transform.Transformer transformer =

javax.xml.transform.TransformerFactory.newInstance().newTransformer();

transformer.setOutputProperty(javax.xml.transform.OutputKeys.ENCODING, "gb2312");

transformer.setOutputProperty(javax.xml.transform.OutputKeys.INDENT, "yes");

transformer.transform(new javax.xml.transform.dom.DOMSource(doc),

new

javax.xml.transform.stream.StreamResult(outFile));

atch (Exception e)

{

System.out.println (e.getMessage());

}}}

4、编程用JAVA 解析XML 的方式.

答:用SAX 方式解析XML，XML 文件如下：

<?xml version=1.0 encoding=gb2312?>

<notes>男,1955 年生,博士，95 年调入海南大学</notes>

</person>

事件回调类SAXHandler.java

import java.io.*;

import java.util.Hashtable;

import org.xml.sax.*;

public class SAXHandler extends HandlerBase

{

private Hashtable table = new Hashtable();

private String currentElement = null;

private String currentValue = null;

public void setTable(Hashtable table)

his.table = table;

}

public Hashtable getTable()

eturn table;

}

public void startElement(String tag, AttributeList attrs)

throws SAXException

urrentElement = tag;

}

public void characters(char[] ch, int start, int length)

throws SAXException

urrentValue = new String(ch, start, length);

}

public void endElement(String name) throws SAXException

{ if (

currentElement.equals(name))

table.put(currentElement, currentValue);

}

SP 内容显示源码,SaxXml.jsp:

<HTML>

<HEAD>

<TITLE>剖析XML 文件people.xml</TITLE>

</HEAD>

<BODY>

<%@ page errorPage=ErrPage.jsp

contentType=text/html;charset=GB2312 %>

<%@ page import=java.io.* %>

<%@ page import=java.util.Hashtable %>

<%@ page import=org.w3c.dom.* %>

<%@ page import=org.xml.sax.* %>

<%@ page import=javax.xml.parsers.SAXParserFactory %>

<%@ page import=javax.xml.parsers.SAXParser %>

<%@ page import=SAXHandler %>

File file = new File(c:\people.xml);

FileReader reader = new FileReader(file);

Parser parser;

SAXParserFactory spf = SAXParserFactory.newInstance();

SAXParser sp = spf.newSAXParser();

SAXHandler handler = new SAXHandler();

sp.parse(new InputSource(reader), handler);

Hashtable hashTable = handler.getTable();

out.println(<TABLE BORDER=2><CAPTION>教师信息表</CAPTION>);

out.println(<TR><TD>姓名</TD> + <TD> +

(String)hashTable.get(new String(name)) + </TD></TR>);

out.println(<TR><TD>学院</TD> + <TD> +

(String)hashTable.get(new String(college))+</TD></TR>);

out.println(<TR><TD>电话</TD> + <TD> +

(String)hashTable.get(new String(telephone)) + </TD></TR>);

out.println(<TR><TD>备注</TD> + <TD> +

(String)hashTable.get(new String(notes)) + </TD></TR>);

out.println(</TABLE>);

</BODY>

</HTML>

5、XML 文档定义有几种形式？它们之间有何本质区别？解析XML 文档有哪几种方式？

a: 两种形式dtd schema，b: 本质区别:schema 本身是xml 的，可以被XML 解析器解析(这也

是从DTD 上发展schema 的根本目的)，c:有DOM,SAX,STAX 等

DOM:处理大型文件时其性能下降的非常厉害。这个问题是由DOM 的树结构所造成的，这

种结构占用的内存较多，而且DOM 必须在解析文件之前把整个文档装入内存,适合对XML 的

随机访问

SAX:不现于DOM,SAX 是事件驱动型的XML 解析方式。它顺序读取XML 文件，不需要一次

全部装载整个文件。当遇到像文件开头，文档结束，或者标签开头与标签结束时，它会触发一

个事件，用户通过在其回调事件中写入处理代码来处理XML 文件，适合对XML 的顺序访问

STAX:Streaming API for XML (StAX)