请求参数的中文乱码问题

1、出现404错误:说明找不到资源,看看映射是否正确。

出现异常:说明Servlet代码有问题。

2、响应消息:中文正确的显示:

响应消息发送回客户端,

响应头字段 ,用response.addHeader("","")设置响应消息的头字段;。

Html文档设置响应消息头字段,用meta标签,它有一个属性是http-equiv设置头字段。  charser=utf-8,编码方式;

***了解中文字符的URL编码:

浏览器对请求参数中的字符(中国)的某种字符集编码(utf-8)进行了url编码

把请求信息发送到web服务器

web服务器先要从请求消息中把每一个参数名和参数值分离出来。

web服务器需要对每一个参数名和参数值进行url解码,也需要针对某种字符集编码进行url解码--------字节数组----------按照某种字符集编码(utf-8)进行编码。

*浏览器怎样进行URL编码:

(1)浏览器对FORM表单中输入的中文字符都会进行URL编码后再传送给WEB服务器。

(2)对于页面中的FORM表单中输入的内容,浏览器将按照当前显示页面时所采用的字符集编码来进行URL编码。

***getParameter方法的中文问题:

(1)getParameter等方法在读取的参数信息时,需要进行URL解码。

(2)对于HTTP请求消息的请求行中的URL地址后的参数,getParameter等方法进行URL解码时所采用的字符集编码在Servlet规范中没有明确规定Tomcat中的ServletRequest对象的getParameter等方法默认采用ISO8859-1字符集编码进行URL解码,因此无法返回正确的中文参数信息 。

(3)对于POST方式下的“application/x-www-form-urlencoded”编码格式的实体内容,getParameter等方法以ServletRequest对象的getCharacterEncoding()方法返回的字符集编码对其进行URL解码。

(4)getCharacterEncoding()方法的返回值通常为null,对于这种情况,ServletRequest对象的getParameter等方法将使用默认的ISO8859-1字符集编码对实体内容中的参数进行URL解码,因此也将无法返回正确的中文参数信息。

(5)ServletRequest接口中定义了一个setCharacterEncoding方法来设置请求消息中的实体内容的字符集编码名称,getParameter方法将以该方法设置的字符集编码对实体内容进行URL解码。

(6)setCharacterEncoding方法设置的是请求消息中的实体内容的字符集编码名称,它只影响getParameter方法对POST方式下的“application/x-www-form-urlencoded”编码格式的实体内容进行URL解码的结果,而不能影响getParameter方法对HTTP请求消息的请求行中的URL地址后的参数进行URL解码的结果。 

当URL地址里包含非西欧字符的字符串时,系统会将这些非西欧转换成如图所示的特殊字符串,那么编码过程中可能涉及将普通字符串和这种特殊字符串的相关转换,这就是需要使用URLDecoder和URLEncoder类

     URLDecoder类包含一个decode(String s,Stringcharcter)静态方法,它可以将看上去乱码的特殊字符串转换成普通字符串
     URLEncoder类包含一个encode(String s,Stringcharcter)静态方法,它可以将普通字符串转换成application/x-www-form-urlencodedMIME字符串

     如下程序代码 
importjava.net.*;

public class URLDecoderTest
{
 public static void main(String[] args)
  throws Exception
 {
  //将application/x-www-form-urlencoded字符串
  //转换成普通字符串
  //其中的字符串直接从上图所示窗口复制过来
  String keyWord =URLDecoder.decode(
   "%CD%F8%C2%E7%CA%B1%BF%D5","UTF-8");
  System.out.println(keyWord);
  //将普通字符串转换成
  //application/x-www-form-urlencoded字符串
  String urlStr =URLEncoder.encode(
   "网络时空" ,"UTF-8");
  System.out.println(urlStr);
 }
}


    上面程序中就是普通中文字符串和application/x-www-form-urlencoded MIME字符串之间的转换.

 当URL地址中仅包含普通非中文字符串和application/x-www-form-urlencodedMIME字符串无须转换,而包含中文字符串的普通字符串则需要转换,换句话说,也就是说URL地址中有"中文字符串"传递时,才会考虑用到上面提到的两个类,这样就可以将传递过来的中文接受后,再还原成原来的中文字符串.如不转换,则通过URL传递过来的中文字符中会变成乱码,无法还原了

原文地址:https://www.cnblogs.com/SamuelSun/p/4723502.html