XML学习总结一

1.声明

<?xml version="1.0"  encoding=“gb2312"?>

version属性
指定该文档遵守的版本号,通常为1.0
XML声明中必需指定version属性

encoding属性
指定编码格式,代表对XML文档进行解码时所用的字符集
该属性为可选项,如果没有指定encoding属性,默认采用UTF-8编码格式
几种常用的编码格式:
简体中文:GB2312或GBK
繁体中文:BIG5
通用的国际编码:Unicode

standalone属性
指定该文档是否需要引用其他资源
该属性合法的取值:yes或no
该属性为可选项

2.元素
XML 元素指的是从(且包括)开始标签直到(且包括)结束标签的部分。
元素可包含其他子元素、文本或者两者的混合。元素也可以拥有属性

元素命名规则
名称可以含字母、数字以及其他的字符,不能包含<、>、,和$等符号
名称不能以数字、中划线和标点符号开始
名称不能以字符 “xml”(或者 XML、Xml)开始
名称不能包含空格
尽量不要出现英文冒号”:”,除非是在使用命名空间

空元素:没有子元素也没有元素内容

<school></school>

<school/>

元素标签大小写敏感

3.实体引用
为了避免发生以上错误,需要用实体引用来代替 这些特殊 字符
解析器在解析这些内容时,会进行正确的转换

实体

描述

字符

&lt; 

小于号

<

&gt; 

大于号

>

&quot;

双引号

"

&apos; 

单引号

'

&amp;

and

&

4.CDATA

不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)
某些文本,比如 JavaScript 代码,包含大量 “<” 或 “&” 字符。为了避免错误,可以将这部分代码放入CDATA中,解析器会忽略CDATA中的内容。
CDATA 语法:由 “<![CDATA[” 开始,由 “]]>” 结束

注释:CDATA 部分不能包含字符串 “]]>”;也不允许嵌套的 CDATA 部分;结尾的 "]]>" 不能包含空格或折行

5.注释
XML文档中可以添加注释,注释中的字符串不会被XML解析器处理
在 XML 中编写注释的语法与 HTML 的语法很相似:

<!-- This is a comment -->

不要把注释放在标签之内
注释中可以包含标签和元素,但一定要保证删除注释后,剩下的内容满足XML的语法规则
不要把注释放在XML声明之前

6.处理指令(ProcessingInstructions, PI)
在XML文档中,有可能包含一些非XML格式的数据(如:样式表),这些数据XML处理器无法处理,需要通过处理指令来告诉其他应用程序如何处理文档中的这些数据
处理指令必须以<?开始,以?>结束

<?处理指令名  处理指令信息?>

开发者可以定义任意的处理指令,但需要自己写程序来处理该指令,使该指令生效
不同的应用程序支持不同的处理指令,应用程序从处理指令中取得目标和数据,执行要求的动作
常见处理指令“xml-stylesheet”:通知XML解析引擎,应用后面指定的css文件显示xml文档中的数据内容,该指令总是放在XML声明之后,第一个元素之前

<?xml-stylesheet  href="hello.css"  type="text/css"?>

注意:XML声明不是处理指令,XML处理程序对XML声明和处理指令采取的是不同的处理方式

原文地址:https://www.cnblogs.com/zjp1997/p/6567011.html