XML文档

XML文档

XML文档的作用

  • 可以用来保存数据
  • 可以用来做配置文件
  • 可以作为数据传输的载体

XML文档的定义

xml文档的声明
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>

version:用来解析XML使用什么版本的解析器用来解析

encoding:解析XML采用的编码

standalone:该文档是否会关联其他文档,yes:是一个独立的文档。no:表示依赖其他文档

标签的定义
  • <>括起来的都叫做元素,元素是成对出现的
  • 文档声明下来的第一个元素叫做根标签
  • 标签里面可以嵌套标签,空标签既是开始也是结束标签,一般配合属性来使用
  • 标签可以自定义
    • 自定义标签名称可以包含字符、数字以及其他的字符
    • 自定义标签不能以数字或者标点符号开始
    • 名称不能以“xml”开始,且名称不能包含空格
  • 便签中的属性
    • 定义在元素里面,<元素名称 属性名称=“属性的值”></元素名称>

XML解析

xml解析其实就是获取元素里面的字符数据或者属性数据

DOM解析,document object model把整个xml全部读到内存中,形成树桩结构。整个文档称之为document对象。属性对应Attribute对象,所有的元素节点对应Element对象,文本也可以称之为Text对象那个,以上所有对象都称之为Node节点,如果xml特别大,那么将会造成内存溢出,可以对文档进行增删操作

SAX解析:Simple API for xml基于事件驱动,读取一行,解析一行,不会造成内存溢出,不可用进行增删,只能查询

使用dom4j进行解析需要添加如下依赖:

<dependency>
    <groupId>dom4j</groupId>
    <artifactId>dom4j</artifactId>
    <version>1.6.1</version>
</dependency>

编写一个xml文档

<?xml version="1.0" encoding="utf-8"?>
<persons>
    <person>
        <name>张三</name>
        <age>23</age>
    </person>
    <person>
        <name>李四</name>
        <age>24</age>
    </person>
</persons>

编写 xml文档解析的代码

public static void main(String[] args) throws DocumentException {

    ClassLoader contextClassLoader = Thread.currentThread().getContextClassLoader();
    URL resource = contextClassLoader.getResource("person.xml");

    SAXReader saxReader=new SAXReader();
    Document document = saxReader.read(resource);
    //得到根元素
    Element rootElement = document.getRootElement();
    //获取根元素下面的所有子元素
    List<Element> elements = rootElement.elements();
    //遍历所有的
    for (Element element : elements) {
        System.out.println(element.element("name").getText());
        System.out.println(element.element("age").getText());
       // System.out.println(element.element("address").getText());
    }

}

XML约束

XML约束是用来规范约束一个XML文档的书写规范

DTD约束
<?xml version="1.0" encoding="UTF-8" ?>
<!--引入dtd来约束这个xml-->
<!--方式一-->
<!--文档类型  跟标签名字 网络上的dtd dtd的名称 dtd的路径-->
<!--<!DOCTYPE stus PUBLIC "//unknown/" "unknown.dtd">-->
<!--方式二-->
<!--引入本地的DTD :跟标签名称 引入本地的DTD dtd的位置-->
<!--<!DOCTYPE stus SYSTEM "stus_copy.dtd">-->

<!--方式三-->

<!DOCTYPE stus [
        <!ELEMENT stus (stu)>
        <!ELEMENT stu (name,age,address)>
        <!ELEMENT name (#PCDATA)>
        <!ELEMENT age (#PCDATA)>
        <!ELEMENT address (#PCDATA)>
        ]>


<stus>
    <stu >
        <name>张三</name>
        <age>23</age>
        <address>北京</address>
    </stu>
    <stu>
        <name>李四</name>
        <age>24</age>
        <address>上海</address>
    </stu>
</stus>

stus_copy.dtd

<!ELEMENT stus (stu)>
<!ELEMENT stu (name,age,address)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT address (#PCDATA)>
Schema约束

语法复杂,功能比较强大

Schema其实就是一个xml,使用xml的语法规则,xml解析器 解析起来比较方便,Schema约束文本内容比DTD内容还要多,没有真正意义替代DTD

约束文档:



    <!-- xmlns  :  xml namespace : 名称空间 /  命名空间
    
    targetNamespace :  目标名称空间 。 下面定义的那些元素都与这个名称空间绑定上。 
    
    elementFormDefault : 元素的格式化情况。  -->
    
    <schema xmlns="http://www.w3.org/2001/XMLSchema" 
    
        targetNamespace="http://www.baidu.com/teacher" 
    
        elementFormDefault="qualified">


​        

        <element name="teachers">
    
            <complexType>
    
                <sequence maxOccurs="unbounded">
    
                    <!-- 这是一个复杂元素 -->
    
                    <element name="teacher">
    
                        <complexType>
    
                            <sequence>
    
                                <!-- 以下两个是简单元素 -->
    
                                <element name="name" type="string"></element>
    
                                <element name="age" type="int"></element>
    
                            </sequence>
    
                        </complexType>
    
                    </element>
    
                </sequence>
    
            </complexType>
    
        </element>
    
    </schema>



实例文档:

    <?xml version="1.0" encoding="UTF-8"?>
    
    <!-- xmlns:xsi : 这里必须是这样的写法,也就是这个值已经固定了。
    
    xmlns : 这里是名称空间,也固定了,写的是schema里面的顶部目标名称空间
    
    xsi:schemaLocation : 有两段: 前半段是名称空间,也是目标空间的值 , 后面是约束文档的路径。
    
     -->
    
    <teachers
    
        xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    
        xmlns="http://www.baidu.com/teacher"
    
        xsi:schemaLocation="http://www.itheima.com/teacher teacher.xsd"
    
    >
    
        <teacher>
    
            <name>zhangsan</name>
    
            <age>19</age>
    
        </teacher>
    
        <teacher>
    
            <name>lisi</name>
    
            <age>29</age>
    
        </teacher>
    
        <teacher>
    
            <name>lisi</name>
    
            <age>29</age>
    
        </teacher>
    
    </teachers>


一个xml如果想指定它的约束规则, 假设使用的是DTD ,那么这个xml只能指定一个DTD , 不能指定多个DTD 。 但是如果一个xml的约束是定义在schema里面,并且是多个schema,那么是可以的。简单的说: 一个xml 可以引用多个schema约束。 但是只能引用一个DTD约束。

名称空间的作用就是在 写元素的时候,可以指定该元素使用的是哪一套约束规则。 默认情况下 ,如果只有一套规则,那么都可以这么写

原文地址:https://www.cnblogs.com/haizhilangzi/p/12310749.html