j2ee高级开发技术课程第二周(web请求的整个过程、XML)

博客非原创,只是收集整理了一下网上的一些文章

一、web请求的整个过程

1)把URL分割成几个部分:协议、网络地址、资源路径。其中网络地址指示该连接网络上哪一台计算机,可以是域名或者IP地址,可以包括端口号;协议是从该计算机获取资源的方式,常见的是HTTP、FTP,不同协议有不同的通讯内容格式;资源路径指示从服务器上获取哪一项资源。
例如:http://www.guokr.com/question/554991/
协议部分:http
网络地址:www.guokr.com
资源路径:/question/554991/

2)如果地址不是一个IP地址,通过DNS(域名系统)将该地址解析成IP地址。IP地址对应着网络上一台计算机,DNS服务器本身也有IP,你的网络设置包含DNS服务器的IP。
例如:www.guokr.com 不是一个IP,向DNS询问请求www.guokr.com 对应的IP,获得IP: 111.13.57.142。这个过程里,你的电脑直接询问的DNS服务器可能没有www.guokr.com 对应的IP,就会向它的上级服务器询问,上级服务器同样可能没有,就依此一层层向上找,最高可达根节点,找到或者全部找不到为止。

3)如果地址不包含端口号,根据协议的默认端口号确定一个。端口号之于计算机就像窗口号之于银行,一家银行有多个窗口,每个窗口都有个号码,不同窗口可以负责不同的服务。端口只是一个逻辑概念,和计算机硬件没有关系。
例如:www.guokr.com 不包含端口号,http协议默认端口号是80。如果你输入的url是http://www.guokr.com:8080/ ,那表示不使用默认的端口号,而使用指定的端口号8080。

4)向2和3确定的IP和端口号发起网络连接。
例如:向111.13.57.142的80端口发起连接

5)根据http协议要求,组织一个请求的数据包,里面包含大量请求信息,包括请求的资源路径、你的身份
例如:用自然语言来表达这个数据包,大概就是:请求 /question/554991/ ,我的身份是xxxxxxx。

6)服务器响应请求,将数据返回给浏览器。数据可能是根据HTML协议组织的网页,里面包含页面的布局、文字。数据也可能是图片、脚本程序等。现在你可以用浏览器的“查看源代码”功能,感受一下服务器返回的是什么东东。如果资源路径指示的资源不存在,服务器就会返回著名的404错误。

7)如果(6)返回的是一个页面,根据页面里一些外链的URL,例如图片的地址,按照(1)-(6)再次获取。

8)开始根据资源的类型,将资源组织成屏幕上显示的图像,这个过程叫渲染,网页渲染是浏览器最复杂、最核心的功能。

9)将渲染好的页面图像显示出来,并开始响应用户的操作。

以上只是最基本的步骤,实际不可能就这么简单,一些可选的步骤例如网页缓存、连接池、加载策略、加密解密、代理中转等等都没有提及。即使基本步骤本身也有很复杂的子步骤,TCP/IP、DNS、HTTP、HTML:每一个都可以展开成庞大的课题,而浏览器的基础——操作系统、编译器、硬件等更是一个比一个复杂。不是计算机专业的同学看了上面的解释完全不明白是很正常的,可能会问为什么要搞得那么复杂,但我保证这每一个步骤都经过深思熟虑和时间的考验。你输入URL即可浏览互联网,而计算机系统在背后做了无数你看不到的工作,计算机各个子领域无数工程师为此付出你难以想象的努力。

二、XML

可扩展标记语言标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。在电子计算机中,标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种的信息比如文章等。它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 它非常适合万维网传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。是Internet环境中跨平台的、依赖于内容的技术,也是当今处理分布式结构信息的有效工具。早在1998年,W3C就发布了XML1.0规范,使用它来简化Internet的文档信息传输。

2.1 xml的用途

2.1.1、数据交换 

用XML在应用程序和公司之间作数据交换已不是什么秘密了,毫无疑问应被列为第一位。 
那么为什么XML在这个领域里的地位这么重要呢?原因就是XML使用元素和属性来描述数 
据。在数据传送过程中,XML始终保留了诸如父/子关系这样的数据结构。几个应用程序 
可以共享和解析同一个XML文件,不必使用传统的字符串解析或拆解过程。 
相反,普通文件不对每个数据段做描述(除了在头文件中),也不保留数据关系结构。使 
用XML做数据交换可以使应用程序更具有弹性,因为可以用位置(与普通文件一样)或用元 
素名(从数据库)来存取XML数据。 

2.1.2、Web服务 

Web服务是最令人激动的革命之一,它让使用不同系统和不同编程语言的人们能够相互交 
流和分享数据。其基础在于Web服务器用XML在系统之间交换数据。交换数据通常用XML标 
记,能使协议取得规范一致,比如在简单对象处理协议(Simple Object Access Protoc 
ol, SOAP)平台上。 
SOAP可以在用不同编程语言构造的对象之间传递消息。这意味着一个C#对象能够与一个 
Java对象进行通讯。这种通讯甚至可以发生在运行于不同操作系统上的对象之间。DCOM 
, CORBA或Java RMI只能在紧密耦合的对象之间传递消息,SOAP则可在松耦合对象之间传 
递消息。 

2.1.3、内容管理 

XML只用元素和属性来描述数据,而不提供数据的显示方法。这样,XML就提供了一个优 
秀的方法来标记独立于平台和语言的内容。 
使用象XSLT这样的语言能够轻易地将XML文件转换成各种格式文件,比如HTML, WML, PD 
F, flat file, EDI, 等等。XML具有的能够运行于不同系统平台之间和转换成不同格式 
目标文件的能力使得它成为内容管理应用系统中的优秀选择。

2.1.4、Web集成 

现在有越来越多的设备也支持XML了。使得Web开发商可以在个人电子助理和浏览器之间 
用XML来传递数据。 
为什么将XML文本直接送进这样的设备去呢?这样作的目的是让用户更多地自己掌握数据 
显示方式,更能体验到实践的快乐。常规的客户/服务(C/S)方式为了获得数据排序或更 
换显示格式,必须向服务器发出申请;而XML则可以直接处理数据,不必经过向服务器申 
请查询-返回结果这样的双向“旅程”,同时在设备也不需要配制数据库。 
甚至还可以对设备上的XML文件进行修改并将结果返回给服务器。想像一下,一台具有互 
联网功能并支持XML的电冰箱将会给市场带来多么大的冲击吧。你从此不必早起去取牛奶 
了! 

2.1.5、配置

许多应用都将配制数据存储在各种文件里,比如.INI文件。虽然这样的文件格式已经使 
用多年并一直很好用,但是XML还是以更为优秀的方式为应用程序标记配制数据。使用. 
NET里的类,如XmlDocument和XmlTextReader,将配制数据标记为XML格式,能使其更具 
可读性,并能方便地集成到应用系统中去。使用XML配制文件的应用程序能够方便地处理 
所需数据,不用象其他应用那样要经过重新编译才能修改和维护应用系统。 
如前所述,这里提到的五种使用XML的途径不包括全部场合。

2.1.6、XML 用于创建新的 Internet 语言

很多新的 Internet 语言是通过 XML 创建的:

其中的例子包括:

  • XHTML - 最新的 HTML 版本
  • WSDL - 用于描述可用的 web service
  • WAP 和 WML - 用于手持设备的标记语言
  • RSS - 用于 RSS feed 的语言
  • RDF 和 OWL - 用于描述资源和本体
  • SMIL - 用于描述针针对 web 的多媒体

2.3 xml的特点

① 简洁有效
XML是一个精简的SGML,它将SGML的丰富功能与HTML的易用性结合到Web应用种,它保留了SGML的可扩展功能,这使得XML从根本上有区别于HTML。并且XML种还包括可扩展格式语言XSL(Extensible Style Language)和可扩展链接语言XLL(Extensible Linking Language)使得XML的显示和解析更加方便快捷。
② 易学易用
XML对SGML进行了精简,它抛弃了SGML中不常用的部分,方便用户编写Web页面同时也给设计人员实现XML浏览器降低了困难。
③ 开放的国际化标准
XML是W3C正式批准的,它完全可用于Web和工具的开发。XML具有标准的名域说明方法,支持文档对象模型标准、可扩展类型语言标准、可扩展链接语言标准和XML指针语言标准。使用XML可以在不同的计算机系统间交换信息,而且还可以跨越国界和超越不同文化疆界交换信息。
④ 高效可扩充
XML支持复用文档片断,使用者可以发明和使用自己的标签,也可以与他人共享,可延伸性大。在XML中,可定义一组无限量的标准,可以有效地进行XML文件的扩充。

原文地址:https://www.cnblogs.com/zgq0/p/8568213.html