ajax中文乱码原因有哪些?
/***********本人原创,欢迎转载,转载请保留本人信息*************/
作者:王力猛 (wallimn) 电邮:wallimn@sohu.com 博客:http://wallimn.bokee.com http://blog.csdn.net/wallimn 时间:2006-11-15 /***********本人原创,欢迎转载,转载请保留本人信息*************/ 开始用JAVA做J2EE项目的时候,很多人会遇到乱码问题,这个比较好解决,网上有很多成熟的解决方案,原理也广为大家所知。 我下面只简述一下这种情况下乱码的原因及解决方案:无论是Struts用的action还是、jsp页面、或者其它,最终会被编译成servlet程序由用户来调用。这些servlet是以UNICODE编码的。其实servlet用什么编码并不重要,重要的是servlet的输入和输出以同样的方案编码就不会有乱码。 常见的乱码有两种:一个是表单提交出现乱码;一个是以地址栏传参数出现乱码。 针对第一种形式的乱码,可以在每个jsp页面加上<%@ page pageEncoding="GB18030"%>注:jsp2.0适用;或者加上<%@ page contentType="text/html; charset=GB18030"%>,“GB2312”、“GBK”、“UTF-8”也可以,反正整个系统中统一就可以。还有一种方式是使用request.setCharsetEncoding("GB18030"),可以使用Filter统一处理。 针对地址栏参数出现乱码的情况,解决方案如下(tomcat适用,其它的没有弄过): 在tomcat的配置文件:server.xml中,找到connector元素,在后面加上一个属性ERIEncoding="GB18030",GB18030是我用的编码方案,在读者的项目中,可以设定成系统中统一使用的编码方案。注意connector元素有两个,一个是针对http,一个是针对https,可以都加上。下面讨论一下Ajax方式下的乱码问题:首先,如果整个项目使用UTF-8编码,并对request(调用xmlhttp对象的setrequestheader("contentType","text/html;charset=uft-8")方法)进行了正确的编码,就不会有乱码;如果整个项目选用了GB18030方案编码,那么一般情况下会出现乱码。产生的原因就是:xmlhttp使用了UTF-8方案对传递的参数进行编码(这也是整个项目使用UTF-8编码不出现乱码的原因)。我们可以做一个试验对此进行验证:
String str ="博客"; String newstr = new String(str.getBytes("UTF-8"),"GB18030"); 如果你的系统使用的WINDOW,项目使用的是GB18030(或者GBK或者GB2312),输出newstr就会是乱码,这个乱码应该与你使用ajax提交中文“博客”所得到的乱码是一致的。 还有个问题, String newstr2=new String(newstr.getBytes("GB18030"),"UTF-8");这样再得到一个新的字符串,这个字符串与初始的字符串str并不相同,最后一个字会是乱码,这个我不知道是什么原因,那们知道原因请告诉我一下。 这样,知道了原理就可以找方法来避免乱码了。经过试验我找到两种方法来解决Ajax的乱码问题(其实原理是一样的): 前提是使用setrequestheader方法进行了正确的编码(POST方式提交数据时,要使用xxx-application-url方案编码,不知写对了没有。呵呵。)。 一、提交中文后,服务器端使用 先使用UTF-8编码提取参数: request.setCharsetEncoding("UTF-8"); String str = request.getParameter("param"); 这样就可以得到正确的参数。 二、可以使用encodeURI进行两次编码,然后在服务器端使用以下方式(这个是我以前的解决方案,显得很土,主要是当时对乱码原理没有弄清): String str = request.getParameter("param"); 然后使用下面的方式进行解码: java.net.URIDecode.decode(str,"UTF-8") 这样同样可以得到正确的参数。详细的例子请看我的另一篇博客文章。