XML的验证模式

前言

  上一篇文章讲述了bean的加载的最关键的三个步骤,这三个步骤很重要,是支撑着Spring容器实现的基础,所以这三个步骤是值得仔细认真的去学习的,其中第一个步骤就是获取XML的验证模式,这篇文章就是讲述这个步骤。

DTD和XSD

DTD:

  DTD(Document Type Definition)即文档类型定义。是一种XML约束模式语言,是XML文件的验证机制,属于XML文件组成的一部分。DTD是一种保证XML文档格式正确的有效方法,可以通过比较XML文档和DTD文件来看文档是否符合规范,元素和标签使用是否正确。

  一个DTD文档包含:元素的定义规则、元素间关系的定义规则、元素可使用的属性、可使用的实体或符号规则。

  要使用DTD验证模式的时候需要在XML文件头部声明,以下是Spring中使用DTD声明方式的代码:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE beans PUBLIC  "-//SPRING//DTD BEAN//EN"  "http://www.springframework.org/dtd/spring-beans.dtd">

  DTD在一定的阶段推动了XML的发展,但是它本身存在着一些缺陷:

  (1)它没有使用XML格式,而是自己定义了一套格式,相对解析器的重用性比较差;而且DTD的构建和访问没有标准的编程接口,因而解析器很难简单的解析DTD文档。

  (2)DTD对元素的类型限制较少;同时其他的约束力也较弱。

  (3)DTD扩展能力较差。

  (4)基于正则表达式的DTD文档的描述能力有限。

XSD:

  针对DTD的缺陷,W3C在2001年推出XSD。XSD(XML Schemas Definition)就是XML Schema语言。XML Schema描述了XML文档的结构。可以用一个指定的XML Schema来验证某个XML文档,以检查该XML文档是否符合其要求。文档设计者可以通过XML Schema指定一个XML文档所允许的结构和内容,并可据此检查一个XML文档是否是有效的。XML Schema本身是一个XML文档,它符合XML语法结构。可以使用通用的XML解析器解析它。

  在使用XML Schema文档对XML实例文档进行检验,除了要声明名称空间外(xmlns=http://www.Springframework.org/schema/beans),还必须指定该名称空间所对应的XML Schema文档的存储位置。通过schemaLocation属性来指定名称空间所对应的XML Schema文档的存储位置,它包含两个部分,一部分是名称空间的URI,另一部分就是该名称空间所标识的XML Schema文件位置或URL地址(xsi:schemaLocation="http://www.Springframework.org/schema/beans http://www.Springframework.org/schema/beans/Spring-beans.xsd")。

  XSD具有以下优势:

  (1)XML Schema基于XML,符合XML语法结构。

  (2)XML Schema可以像其他XML文件一样解析和处理。

  (3)XML Schema比DTD提供更丰富的数据类型。

  (4)XML Schema提供可扩充的数据模型。

  (5)XML Schema支持综合命名空间。

  (6)XML Schema支持属性组。

验证模式的获取

  在了解了DTD和XSD 的区别后,我们再来分析Spring中对于验证模式的读取就更容易理解了。通过我们上一篇文章的分析,我们锁定了getValidationModeForResource方法来获取对应资源的验证模式,下面来看一下这个方法的源码:

 1   protected int getValidationModeForResource(Resource resource) {
 2         int validationModeToUse = getValidationMode();
 3         if (validationModeToUse != VALIDATION_AUTO) {
 4             return validationModeToUse;
 5         }
 6         int detectedMode = detectValidationMode(resource);
 7         if (detectedMode != VALIDATION_AUTO) {
 8             return detectedMode;
 9         }
10         // Hmm, we didn't get a clear indication... Let's assume XSD,
11         // since apparently no DTD declaration has been found up until
12         // detection stopped (before finding the document's root tag).
13         return VALIDATION_XSD;
14     }

  可以看出,方法的实现其实还是很简单的,在代码第3行的意思是:如果手动指定了验证模式则使用指定的验证模式。代码第6行:如果未指定则使用自动检测。所以,该方法的逻辑就是:如果设定了验证模式则使用设定的验证模式(可以通过调用 XmlBeanDefinitionReader中的setValidationMode方法进行设定),否则使用自动检测的方式。

  而自动检测验证模式的功能是在函数detectValidationMode方法中实现的,在detectValidationMode函数中又将自动检测验证模式的工作委托给了专门处理类XmlValidationModeDetector,调用了XMLValidationModeDetector的validationModeDetector方法,具体方法如下:

XmlBeanDefinitionReader.detectValidationMode(Resource resource):

 1 protected int detectValidationMode(Resource resource) {
 2         if (resource.isOpen()) {
 3             throw new BeanDefinitionStoreException(
 4                     "Passed-in Resource [" + resource + "] contains an open stream: " +
 5                     "cannot determine validation mode automatically. Either pass in a Resource " +
 6                     "that is able to create fresh streams, or explicitly specify the validationMode " +
 7                     "on your XmlBeanDefinitionReader instance.");
 8         }
 9 
10         InputStream inputStream;
11         try {
12             inputStream = resource.getInputStream();
13         }
14         catch (IOException ex) {
15             throw new BeanDefinitionStoreException(
16                     "Unable to determine validation mode for [" + resource + "]: cannot open InputStream. " +
17                     "Did you attempt to load directly from a SAX InputSource without specifying the " +
18                     "validationMode on your XmlBeanDefinitionReader instance?", ex);
19         }
20 
21         try {
22             return this.validationModeDetector.detectValidationMode(inputStream);
23         }
24         catch (IOException ex) {
25             throw new BeanDefinitionStoreException("Unable to determine validation mode for [" +
26                     resource + "]: an error occurred whilst reading from the InputStream.", ex);
27         }
28     }

XmlValidationModeDetector.detectValidationMode(InputStream inputStream):

 1 public int detectValidationMode(InputStream inputStream) throws IOException {
 2         // Peek into the file to look for DOCTYPE.
 3         BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream));
 4         try {
 5             boolean isDtdValidated = false;
 6             String content;
 7             while ((content = reader.readLine()) != null) {
 8                 content = consumeCommentTokens(content);
 9                 if (this.inComment || !StringUtils.hasText(content)) {
10                     continue;
11                 }
12                 if (hasDoctype(content)) {
13                     isDtdValidated = true;
14                     break;
15                 }
16                 if (hasOpeningTag(content)) {
17                     // End of meaningful data...
18                     break;
19                 }
20             }
21             return (isDtdValidated ? VALIDATION_DTD : VALIDATION_XSD);
22         }
23         catch (CharConversionException ex) {
24             // Choked on some character encoding...
25             // Leave the decision up to the caller.
26             return VALIDATION_AUTO;
27         }
28         finally {
29             reader.close();
30         }
31     }

  第一段代码没有什么需要解释的,就是调用了XMLValidationModeDetector类的detectValidationMode(inputStream)方法。

  第二段代码第9行:如果读取的行是空或者是注释则略过。代码第16行:读取到“<”开始符号时直接退出,因为验证模式一定在开始符号之前。

  总的来说,Spring用来检测验证模式的办法就是判断是否包含DOCTYPE,如果包含就是DTD,否则就是XSD。

至此,已经将加载Bean的第一个步骤,获取验证模式分析完毕,下篇文章将讲述Bean加载的第二个步骤:获取Document实例。

参考:《Spring源码深度解析》 郝佳 编著:

作者:Joe
努力了的才叫梦想,不努力的就是空想,努力并且坚持下去,毕竟这是我相信的力量
原文地址:https://www.cnblogs.com/Joe-Go/p/10059073.html