中文乱码问题

tech2024-12-04  7

中文乱码问题

原理:由于http底层使用的是tcp协议 是一种面向连接的可靠地字节流协议 在请求中 这些字节均以%开头 并以十六进制出现 例如%5A%8D

乱码如何产生

当用户通过浏览器提交一个包含UTF—8编码格式的中文请求时候 浏览器会将一个中文字符转化为三个字节(一般一个utf-8汉字占三个字节)

即形成三个类似%5A的字节表示形式 并将这三个字节上传给Tomcat服务器 Tomcat接收到字节后 并不知道他源底层采用什么字符编码 Tomcat默认使用的格式ISO-8859-1 这个格式不支持中文 所以会将字节按照这个方式编码 显示出来就会是乱码

解决方法

写在servlet中或者过滤器中 当你接收到请求后进行格式更改

post:设置setCharacterEncoding()设置请求中 中文的字符编码

注意:这个只解决post 不能解决get 因为get提交的中文是通过url提交的 不在请求正文中

get:在Tomcat9之后的版本解决了这个问题

但是9前还要设置

​ 在servlet中将你的中文打散再组装

//获取你的name 其编码格式为ISO8859-1 String name = request.getParamter("name"); //打散:将name字符串按照原编码进行打散 byte[] bytes = name.getBytes("ISO8859-1"); //组装:将bytes字节数组按照指定的字符编码进行组装 name = new String (bytes,"utf-8");
最新回复(0)