URL转义

URL中的字符只能是ASCII字符,但是ASCII字符比较少,而URL则常常包含ASCII字符集以外的字符,如非英语字符、汉字、特殊符号等等,所以要对URL进行转换。这个过程就叫做URL编码,或者叫URL转义,实质上就是将包含非ASCII字符的URL转换为有效的ASCII字符格式。

在进行URL编码时,每一个非ASCII字符都被替换为“%hh”格式,其中hh为两位十六进制数,它对应于该字符在ISO-8859-1字符集里的编码值。比如“中国”这两个汉字出现在URL,就要将他们转为“%D6%D0%B9%FA”,由于一个汉字需要两个字节,所以“中国”被替换成了四个ASCII字符。

[java] view plain copy
 
  1. public static void main(String[] args) throws UnsupportedEncodingException{  
  2.         String s = "zhaoxiaofnag%40eims.com.cn ";  
  3.         s=URLDecoder.decode(s,"utf-8");  
  4.         System.out.println(s);  
  5.           
  6.         String china = "%31%32%36%2E%61%6D/hEeGv4";  
  7.         china = URLDecoder.decode(china,"utf-8");  
  8.         System.out.println(china);  
  9.     }  



[plain] view plain copy
 
    1. 另附上ASCII字符与URL编码的对照表。  
    2.   
    3. ASCII字符   URL编码  
    4. 空格     %20  
    5. !     %21  
    6. "    %22  
    7. #   %23  
    8. $    %24  
    9. %   %25  
    10. &    %26  
    11. '     %27  
    12. (    %28  
    13. )    %29  
    14. *    %2A  
    15. +   %2B  
    16. ,     %2C  
    17. -     %2D  
    18. .     %2E  
    19. /    %2F  
    20. 0    %30  
    21. 1    %31  
    22. 2    %32  
    23. 3    %33  
    24. 4    %34  
    25. 5    %35  
    26. 6    %36  
    27. 7    %37  
    28. 8    %38  
    29. 9    %39  
    30. :     %3A  
    31. ;     %3B  
    32. <   %3C =   %3D >   %3E  
    33. ?    %3F  
    34. @   %40  
    35. A    %41  
    36. B    %42  
    37. C    %43  
    38. D    %44  
    39. E    %45  
    40. F    %46  
    41. G    %47  
    42. H    %48  
    43. I    %49  
    44. J    %4A  
    45. K    %4B  
    46. L    %4C  
    47. M   %4D  
    48. N    %4E  
    49. O   %4F  
    50. P    %50  
    51. Q   %51  
    52. R    %52  
    53. S    %53  
    54. T    %54  
    55. U    %55  
    56. V    %56  
    57. W   %57  
    58. X    %58  
    59. Y    %59  
    60. Z    %5A  
    61. [    %5B  
    62.     %5C  
    63. ]    %5D  
    64. ^   %5E  
    65. _    %5F  
    66. `    %60  
    67. a    %61  
    68. b    %62  
    69. c    %63  
    70. d    %64  
    71. e    %65  
    72. f     %66  
    73. g    %67  
    74. h    %68  
    75. i     %69  
    76. j     %6A  
    77. k    %6B  
    78. l     %6C  
    79. m   %6D  
    80. n    %6E  
    81. o    %6F  
    82. p    %70  
    83. q    %71  
    84. r     %72  
    85. s    %73  
    86. t     %74  
    87. u    %75  
    88. v    %76  
    89. w   %77  
    90. x    %78  
    91. y    %79  
    92. z    %7A  
    93. {    %7B  
    94. |    %7C  
    95. }    %7D  
    96. ~   %7E  
    97. %7F  
    98. €    %80  
    99. %81  
    100. ‚    %82  
    101. ƒ    %83  
    102. „    %84  
    103. …   %85  
    104. †    %86  
    105. ‡    %87  
    106. ˆ    %88  
    107. ‰  %89  
    108. Š    %8A  
    109. ‹     %8B  
    110. Œ   %8C  
    111. %8D  
    112. Ž    %8E  
    113. %8F  
    114. %90  
    115. ‘   %91  
    116. ’   %92  
    117. “   %93  
    118. ”   %94  
    119. •    %95  
    120. –    %96  
    121. —  %97  
    122. ˜    %98  
    123. ™   %99  
    124. š    %9A  
    125. ›     %9B  
    126. œ   %9C  
    127. %9D  
    128. ž    %9E  
    129. Ÿ    %9F  
    130. %A0  
    131. ¡     %A1  
    132. ¢    %A2  
    133. £    %A3  
    134. %A4  
    135. ¥    %A5  
    136. |    %A6  
    137. §    %A7  
    138. ¨    %A8  
    139. ©   %A9  
    140. ª    %AA  
    141. «    %AB  
    142. ¬   %AC  
    143. ¯    %AD  
    144. ®   %AE  
    145. ¯    %AF  
    146. °    %B0  
    147. ±   %B1  
    148. ²    %B2  
    149. ³    %B3  
    150. ´     %B4  
    151. µ    %B5  
    152. ¶    %B6  
    153. ·     %B7  
    154. ¸     %B8  
    155. ¹    %B9  
    156. º    %BA  
    157. »    %BB  
    158. ¼   %BC  
    159. ½   %BD  
    160. ¾   %BE  
    161. ¿    %BF  
    162. À    %C0  
    163. Á    %C1  
    164.     %C2  
    165. à   %C3  
    166. Ä    %C4  
    167. Å    %C5  
    168. Æ   %C6  
    169. Ç    %C7  
    170. È    %C8  
    171. É    %C9  
    172. Ê    %CA  
    173. Ë    %CB  
    174. Ì    %CC  
    175. Í    %CD  
    176. Π   %CE  
    177. Ï    %CF  
    178. Р  %D0  
    179. Ñ    %D1  
    180. Ò   %D2  
    181. Ó   %D3  
    182. Ô   %D4  
    183. Õ   %D5  
    184. Ö   %D6  
    185. %D7  
    186. Ø   %D8  
    187. Ù    %D9  
    188. Ú    %DA  
    189. Û    %DB  
    190. Ü    %DC  
    191. Ý    %DD  
    192. Þ    %DE  
    193. ß    %DF  
    194. à    %E0  
    195. á    %E1  
    196. â    %E2  
    197. ã    %E3  
    198. ä    %E4  
    199. å    %E5  
    200. æ   %E6  
    201. ç    %E7  
    202. è    %E8  
    203. é    %E9  
    204. ê    %EA  
    205. ë    %EB  
    206. ì     %EC  
    207. í     %ED  
    208. î     %EE  
    209. ï     %EF  
    210. ð    %F0  
    211. ñ    %F1  
    212. ò    %F2  
    213. ó    %F3  
    214. ô    %F4  
    215. õ    %F5  
    216. ö    %F6  
    217. ÷   %F7  
    218. ø    %F8  
    219. ù    %F9  
    220. ú    %FA  
    221. û    %FB  
    222. ü    %FC  
    223. ý    %FD  
    224. þ    %FE  
    225. ÿ    %FF  from:http://blog.csdn.net/sunhuwh/article/details/41809909
原文地址:https://www.cnblogs.com/liuqiyun/p/6970185.html