JavaWeb_05_xml相关&dtd快速入门

学东西怎么学,是什么,能做什么,怎么去做!!

1.xml的简介

1.eXtensible Markup Language:可扩展标记型语言

  • 标记型语言:html是标记型语言
    • 也是使用标签来操作
  • 可扩展
    • html里面的标签是固定,每个标签都有特定的含义<h1> <br/> <hr/>
    • 标签可以自己定义,可以写中文的标签<person></person> <猫></猫>

2.xml用途

  • html是用于显示数据,xml也可以显示数据(不是主要功能)
  • xml主要功能,为了存储数据

3.xml是w3c组织发布的技术

4.xml有两个版本 1.0 1.1

  • 使用都是1.0版本,(1.1版本不能向下兼容)

2.xml的应用

1.不同的系统之间的传输数据

2.用来表示生活中有关系的数据

3.经常用在配置文件

  • 比如现在连接数据库,肯定知道数据库的用户名和密码,数据库名称
  • 如果修改数据库的信息,不需要修改源代码,只要修改配置文件就可以了

3.xml的语法

1.xml的文档声明

* 创建一个文件 后缀名是 .xml
* 如果写xml,第一步 必须要有一个文档声明(写了文档声明之后,表示写xml文件的内容)
* `<?xml version="1.0" encoding="utf-8" ?>`
* 文档声明必须写在 第一行 第一列
* 属性
	* version:xml的版本 1.0(使用) 1.1
	* encoding:xml编码 gbk utf-8 iso8859-1(不包含中文)
	* standalone:是否需要依赖其他文件 yes/no
* xml的中文乱码问题解决
	* 画图分析乱码问题
	* 保存时候的编码和设置打开时候的编码一致,不会出现乱码

2.定义元素(标签)

3.定义属性

4.注释

5.特殊字符

6.CDATA区(了解)

7.PI指令(了解)

4.xml的元素定义

1.标签定义

  • 标签定义有开始必须要有结束:<person></person>
  • 标签没有内容,可以在标签内结束:<aa/>
  • 标签可以嵌套,但必须是包含形式的嵌套
  • 一个xml中,只能有一个根标签,其他标签都是这个标签下面的标签
  • 在xml中把空格和换行都当成内容来解析,下面这两段代码含有是不一样的。
<aa>1111111111</aa>
------
<aa>
	1111111111
</aa>
  • xml标签可以是中午
  • xml中标签的名称规则
    • xml代码区分大小写
    • xml的表情不能以数字和下划线(_)开头
    • xml的标签不能以xml,XML,Xml等开头
    • xml的标签不能包含空格和冒号

5.xml中属性的定义

1.html是标记型文档,可以有属性
2.xml也是标记型文档,可以有属性
3.属性定义的要求

* 一个标签上可以有多个属性
* 属性名称不能相同
* 属性名称和属性值之间使用= ,属性值使用引号包起来(可以是单引号,也可以是双引号)
* xml属性的名称规范和原始的名称规范一致

6.xml中的注释

1.写法<!-- xml注释 -->
2.注释不能嵌套
3.注释也不能放到第一行,第一行第一列必须放文档声明

7.xml中的特殊字符

1.如果想要在xml中显示a<b,不能正常显示,因为把<当作标签
2.如果就想要显示,需要对特殊字符 < 进行转义

特殊字符    1替代符号
   &         &amp;
   <         &lt;
   >         &gt;
   "         &quot;
   '         &apos;

8.CDATA区

1.可以解决多个字符都需要转义的操作 if(a<b && b<c && d>f) {}
2.把这些内容放到CDATA区里面,不需要转义了
3.写法<![CDATA[ if(a<b && b<c && d>f) {} ]]>
4.把特殊字符,当作文本内容,而不是标签

9.PI指令(处理指令)

1.可以在xml中设置样式
2.写法:<?xml-stylesheet type="text/css" href="css的路径">
3.设置样式,只能对英文标签名称起作用,对于中文的标签名称不起作用的。

10.xml的语法的总结

1.所有 XML 元素都须有关闭标签
2.XML 标签对大小写敏感
3.XML 必须有正确地嵌套顺序
4.XML 文档必须有根元素(只有一个)
5.XML 的属性值须加引号
特殊字符必须转义 --- CDATA
6.XML 中的空格、回车换行会解析时被保留

11.xml的约束

1.为什么需要约束
比如现在定义一个person的xml文件,只想要这个文件里面保存人的信息,比如name age等,但是如果在xml文件中写了一个标签<猫>,发现可以正常显示,因为符合语法规范,但是猫肯定不是人的信息,xml的标签是自定义的,需要技术来规定xml中只能出现的元素,这个时候需要约束。

2.xml的约束技术:dt的约束 和 schema约束

12.dtd的快速入门

1.创建一个文件 后缀名 .dtd
步骤:

  • 看xml中有多少个元素,有几个元素,在dtd文件中写几个<!ELEMENT>
  • 判断元素是简单元素还是复杂元素
    • 复杂元素:有子元素的元素 <!ELEMENT 元素名称 (子元素)>
    • 简单元素:没有子元素 <ELEMENT 元素名称 (#PCDATA) >
  • 需要在xml文件中引入dtd文件 <!DOCTYPE 根元素名称 SYSTEM "dtd文件的路径">

2.打开xml文件使用浏览器打开的,浏览器只负责校验xml的语法,不负责校验约束
3.如果想要校验xml的约束,需要使用工具(myeclipse工具)
4.打开myeclipse开发工具

* 创建一个项目 test
* 在test的src目录下面创建一个xml文件和一个dtd文件
* 当xml中引入dtd文件之后,比如只能出现name age,多写了一个a,会提示出错

13.dtd的三种引入方式

1.引入外部的dtd文件 <!DOCTYPE 根元素名称 SYSTEM "dtd"路径>
2.使用内部的dtd文件

<!DOCTYPE person [
	<!ELEMENT person (name,age)>
	<!ELEMENT name (#PCDATA)>
	<!ELEMENT age (#PCDATA)>
]>

3.使用外部的dtd文件(网络上的dtd文件)

  • <!DOCTYPE 根元素 PUBLIC "DTD名称" "DTD文档的URL">
  • 后面学到的框架struts2使用配置文件 使用 外部的dtd文件
  • <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.0//EN" "http://struts.apache.org/dtds/struts-2.0.dtd">

14.使用dtd定义元素

1.语法:<!ELEMENT 元素名 约束>
2.简单元素:没有子元素的元素

  • <!ELEMENT name (#PCDATA)>

    • (#PCDATA):约束name是字符串类型
    • EMPTY :元素为空(没有内容)
    • ANY:任意
      3.复杂元素:
  • <!ELEMENT person (name,age,sex,school)>

    • 子元素只能出现一次
  • <!ELEMENT 元素名称 (子元素>

  • 表示子元素出现的次数

    • + 表示一次或者多次
    • ? 表示零次或者一次
    • * 表示零次或者多次
  • 子元素直接使用逗号进行隔开

    • 表示元素出现的顺序
  • 子元素直接使用|进行隔开

    • 表示元素只能出现其中的任意一个

15.使用dtd定义属性

1.语法:<!ATTLIST 元素名称 属性名称 属性类型 属性的约束>
2.属性类型

  • CDATA:字符串
  • 枚举:表示只能在一定的范围内出现值,但是只能每次出现其中的一个
  • ID:值只能是字母或者下划线开头

3.属性的约束

  • #REQUIRED:属性必须存在
  • #IMPLIED:属性可有可无
  • #FIXED:表示一个固定值 #FIXED "AAA"
    • 属性的值必须是设置的这个固定值
  • 直接值
    • 不写属性,使用直接值
    • 写了属性,使用设置那个值

16.实体的定义

1.语法: <!ENTITY 实体名称 "实体的值">

  • <!ENTITY TEST "HAHAHEHE">
  • 使用实体 &实体名称; 比如 &TEST;

2.注意

  • 定义实体需要写在内部dtd里面,如果写在外部的dtd里面,有某些浏览器下,内容得不到。

17.xml的解析的简介(写到java代码)

1.xml是标记型文档
2.js使用dom解析标记型文档?

  • 根据html的层级结构,在内存中分配一个树形结构,把html的标签,属性和文本都封装成对象
  • document对象、element对象、属性对象、文本对象、Node节点对象

3.xml的解析方式(技术):dom和sax

  • 画图分析使用dom和sax解析xml过程

  • dom方式解析

    • 根据xml的层级结构在内存中分配一个树形结构,把xml的标签,属性和文本都封装成对象
    • 缺点:如果文件过大,造成内存溢出
    • 优点:很方便实现增删改操作
  • sax方式解析

    • 采用事件驱动,边读边解析
      • 从上到下,一行一行的解析,解析到某一个对象,返回对象名称
    • 缺点:不能实现增删改操作
    • 优点:如果文件过大,不会造成内存溢出,方便实现查询操作

    4.想要解析xml,首先需要解析器

    • 不同的公司和组织提供了针对dom和sax方式的解析器,通过api方式提供
      • sun公司提过了针对dom和sax解析器 jaxp
      • dom4j组织,针对dom和sax解析器 dom4j(*** 实际开发中)
      • jdom组织,针对dom和sax解析器 jdom
原文地址:https://www.cnblogs.com/flatcc/p/7380572.html