中文乱码问题
编码解码,与乱码问题原因
- 字符编码的概念
- 将字符转换成成二进制数据的过程,称为编码。
- 字符解码的概念
- 将二进制数据转换成字符的过程,称为解码。
- 中文乱码的原因
- 一段中文文本,如果使用A字符集进行编码,却使用B字符集进行解码,就导致原来的字符还原错误,所以导致乱码出现。
- 解决乱码的根本方法
- 统一编码和解码的字符集。
- 如果无法做到统一编码,解码。那么使用错误的解码字符集重新对”已经错误解码的数据“进行编码,从而还原成原来二进制流数据。然后再找正确的字符集进行编码。(不过推荐配置统一编码解码,而不是采用还原编码的形式处理。)
Servlet响应中文乱码问题与处理
-
响应数据乱码的原因:
- 服务器发回给浏览器的响应数据,之所以有乱码,是因为浏览器端不知道服务器端采用的何种格式进行的编码。所以采用了浏览器默认设置的编码进行了二进制数据流的解码。如果编解码字符集对应错误,那么就产生了中文乱码。(比如浏览器默认GBK,而服务器发回的数据采用UTF-8)
-
响应数据乱码的解决办法:
- 在响应数请求头中添加Content-Type,以及CharacterType来告诉浏览器,数据的文本格式以及编码格式。
resp.setContentType("text/html;charset=utf-8"); resp.getWriter().write("你好,这是中文乱码");
resp.setContentType("text/html"); resp.setCharacterEncoding("utf-8"); resp.getWriter().write("你好,这是中文乱码");
Servlet请求乱码的问题与处理
- 请求乱码的原因
- tomcat并不识别浏览器传过来的编码设置。而是默认的使用了’ISO-8859-1’编码。导致浏览器端传过来的数据编码解码不统一,从而出现了中文乱码问题。
Servlet Get请求乱码问题与处理
- GET请求乱码出现的时间
- 对于URI上的参数乱码,是在tomcat内部中Connector对象处理请求参数进行的解码操作。所以在Servlet中去设置编码,已经不起作用。
- GET请求的乱码处理方法
- 在tomcat的server.xml中去配置的配置上加上 URIEncoding属性。 URIEncoding=“utf-8”
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="utf-8"/>
Servlet Post请求乱码问题与处理
- POST请求乱码出现的时间
- POST请求体内的参数,是以HttpBody的形式存在的。直到第一次调用 request.getParameter(“xxx”)时,才会对参数进行解析。解码错误的时间就发生在此时的解析过程中。
- POST请求体内的参数,是以HttpBody的形式存在的。直到第一次调用 request.getParameter(“xxx”)时,才会对参数进行解析。解码错误的时间就发生在此时的解析过程中。
- POST乱码的处理方法
- 在Servlet中获取参数之前去设置 resp.setCharacterEncoding(“utf-8”);
req.setCharacterEncoding("utf-8"); String username = req.getParameter("username");
- 或者创建一个拦截器,在拦截器中对HttpServletRequest设置编码。
#比如spring中的编码拦截器 <!-- 配置字符编码过滤器 --> <filter> <filter-name>CharacterEncodingFilter</filter-name> <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class> <init-param> <param-name>encoding</param-name> <param-value>utf-8</param-value> </init-param> </filter> <filter-mapping> <filter-name>CharacterEncodingFilter</filter-name> <url-pattern>/*</url-pattern> </filter-mapping>
Servlet 文件下载文件名乱码问题与处理
未完待续 todo (还未复习到文件上传下载的地方)