xml基础学习笔记

1 XML入门

              1.1 引入

                   HTML: 负责网页的结构       

                   CSS: 负责网页的样式(美观)

                   Javascript: 负责在浏览器端与用户进行交互。

                    负责静态的网页制作的语言

                      HTML语言特点:

                       1)由标签组成。 <title> <p> <hr/> <br/>

                      2)语法结构松散的    <p></p>   <p>  <P>

                            大小写不区分

                                  结束标签和开始标签不一定匹配

<html>

         <head>

                   <title>this is title</title>

         </head>

         <body>

                   <p>html标签</p>

                   <P>html标签</P>

                   <abc>abc标签</abc>  自定义标签

         </body>

</html>

         这种自定义标签可以把他们叫做xml标签。

                  

              1.2 HTML和XML的区别 

                                     HTML                                      XML   

    名称:       HyperText Markup Languae(超文本标记语言)    Extend Markup Languge(可扩展标签语言)

    标签:     标签是w3c组成指定,固定的,约100来个         标签由开发者自己制定的(要按照一定的语法定义)

    作用:        负责网页的结构     

        1)描述带关系的数据(作为软件的配置文件): 包含与被包含的关系  properties文件:

              key-value     

               name=eric   

              password=123456

                                    <user>

                                                 <name>eric</name>

                                                  <password>123456</password>

                                   </user>

          场景:

                                 tomcat

                                struts Hibernate spring (三大框架)

                  2)作为数据的载体(存储数据,小型的“数据库”)

2 XML作用

              2.1 描述带关系的数据(软件的配置文件)

                            web服务器(PC):

                            学生管理系统 -> 添加学生功能 -> 添加学生页面 -> name=eric&email=eric@qq.com 

                                     前提: 网络(IP地址: oracle:255.43.12.54  端口:1521 )

                                     java代码:使用ip(255.43.12.54)地址和端口(1521),连接oracle数据库,保存学生数据。

                                     把ip地址端口配置到xml文件:

                                                        host.xml

                                                                 <host>

                                                                           <ip>255.43.12.55</ip>

                                                                           <port>1521</port>

                                                                 </host>

                            数据库服务器(PC):

                                                        主服务器(255.43.12.54):Oracle数据库软件(负载)

                                                        副服务器(255.43.12.55):Oracle数据库软件

              2.2 数据的载体(小型的“数据库”)

                            教师管理系统:   姓名   工龄+1  邮箱

                            发教师数据给财务管理系统:

                                               String teacher =    name=张三&email=zhangsan@qq.com&workage=2  字符串

                                                                 (问题: 1)不好解析 2)不是规范)

                                              teacher.xml

                                                        <teacher>        

                                                                           <name>张三</name>

                                                                           <email>zhangsan@qq.com</email>

                                                                           <workage>2</workage>

                                                        </teacher>

                                               这种一种规范

                            财务管理系统:   

                                                        姓名   工龄+1  邮箱

                                               发奖金:   统计奖金。   工龄
                                               发邮件功能:

                                                                 邮箱   姓名   金额

                            方案一: 在财务管理系统中维护了一套教师信息。

                                               每年 : 工龄增加  维护了两个系统的信息。

                            方案二: 教师信息只在教学管理系统中维护。

3 XML语法

                   xml文件以xml后缀名结尾。

                   xml文件需要使用xml解析器去解析。浏览器内置了xml解析器。

              3.1 标签

                            语法: <student></student>  开始标签  标签体内容  结束标签

                                     1)<student/> 或 <student></student> 空标签。没有标签体内容

                                     2)xml标签名称区分大小写。

                                     3)xml标签一定要正确配对。

                                     4)xml标签名中间不能使用空格

                                     5)xml标签名不能以数字开头

                                     6)注意: 在一个xml文档中,有且仅有一个根标签

              3.2 属性

                            语法: <Student name="eric">student</Student>

                            注意:

                                               1)属性值必须以引号包含,不能省略,也不能单双引号混用!!!

                                               2)一个标签内可以有多个属性,但不能出现重复的属性名!!!

              3.3 注释

                                               语言: <!--  xml注释 -->

                   练习:

                                     通讯录系统

                                     联系人数据:编号 (唯一的) 姓名   年龄   电话 邮箱  QQ

                            要求:

                                     contact.xml

                                               1)设计一个xml文件,用于存储联系人数据

                                               2)这个xml文件可以多个联系人。

              3.4 文档声明

                   语法: <?xml version="1.0" encoding="utf-8"?>

                   version: xml的版本号

                   encoding: 解析xml文件时查询的码表(解码过程时查询的码表)

                   注意:

                                     1)如果在ecplise工具中开发xml文件,保存xml文件时自动按照文档声明的encoding来保存文件。

                                     2)如果用记事本工具修改xml文件,注意保存xml文件按照文档声明的encoding的码表来保存。

              3.5 转义字符

                   在xml中内置了一些特殊字符,这些特殊字符不能直接被浏览器原样输出。如果希望把这些特殊字符按照原样输出到浏览器,对这些特殊字符进行转义。转义之后的字符就叫转义字节。

                                    特殊字符  转义字符

                                      <         &lt;

                                      >         &gt;

                                      "         &quot;

                                     &         &amp;

                                     空格      &nsbp;

                                    

              3.6 CDATA块

                   作用: 可以让一些需要进行包含特殊字符的内容统一进行原样输出。

              3.7 处理指令

                            作用: 告诉xml解析如果解析xml文档

                           

                            案例: <?xml-stylesheet type="text/css" href="1.css"?> 告诉xml解析该xml文档引用了哪个css文件

                                     需要提前xml内容可以使用xml-stylesheet指令指令

                                    

        

4 XML解析 

              4.1 引入

                   xml文件除了给开发者看,更多的情况使用程序读取xml文件的内容。这叫做xml解析

              4.2 XML解析方式(原理不同)

                            DOM解析

                            SAX解析

              4.3 XML解析工具

                                     DOM解析原理:

                                                        1)JAXP (oracle-Sun公司官方)

                                                        2)JDOM工具(非官方)

                                                        3)Dom4J工具(非官方)

                                                                 三大框架(默认读取xml的工具就是Dom4j)

                                                        .......

                                     SAX解析原理:

                                                        1)Sax解析工具(oracle-sun公司官方)

              4.4 什么是DOM解析

                            DOM解析原理:xml解析器一次性把整个xml文档加载进内存,然后在内存中构建一颗Document的对象树,通过Document对象,得到树上的节点对象,通过节点对象访问(操作)到xml文档的内容。

              4.5 Dom4j工具

                            非官方,不在jdk中。

                            使用步骤:

                                     1)导入dom4j的核心包。 dom4j-1.6.1.jar

                                     2)编写Dom4j读取xml文件代码

                                 

public static void main(String[] args) {

       try {

           //1.创建一个xml解析器对象

           SAXReader reader = new SAXReader();

           //2.读取xml文档,返回Document对象

           Document doc = reader.read(new File("./src/contact.xml"));

          

           System.out.println(doc);

       } catch (DocumentException e) {

           e.printStackTrace();

           throw new RuntimeException(e);

       }

      

    }

              4.6 Domj4读取xml文件

                                     节点:

                                               Iterator  Element.nodeIterator();  //获取当前标签节点下的所有子节点

                                     标签:

                                                 Element  Document.getRootElement();  //获取xml文档的根标签             

                                                Element   ELement.element("标签名") //指定名称的第一个子标签

                                                 Iterator<Element> Element.elementIterator("标签名");// 指定名称的所有子标签

                                                        List<Element> Element.elements(); //获取所有子标签

                                                       

                                      属性:

                                               String   Element.attributeValue("属性名") //获取指定名称的属性值

                                                Attribute    Element.attribute("属性名");//获取指定名称的属性对象     

                                                                 Attribute.getName()  //获取属性名称

                                                                 Attibute.getValue()  //获取属性值

                                                        List<Attribute>         Element.attributes();  //获取所有属性对象

                                                        Iterator<Attribute>          Element.attibuteIterator(); //获取所有属性对象

                                     文本:

                                                                 Element.getText();  //获取当前标签的文本

                                                                 Element.elementText("标签名") //获取当前标签的指定名称的子标签的文本内容

                                    

                   练习:

                          把写的contact.xml文件内容,使用dom4j完整地读取并打印出来。

                            总结:

                                     1)XML的作用

                                                配置文件(最常见)

                                                作为数据库

                                     2)XML语法

                                     3)XML解析(DOM解析)

                                                3.1 DOM解析原理

                                                3.2 Dom4j工具(基于DOM解析)

                                                                 读取:

                                                                           节点

                                                                                    标签节点

                                                                                    属性节点

                                                                                    文本节点

原文地址:https://www.cnblogs.com/jesonjason/p/5215769.html