原理:由于http底层使用的是tcp协议 是一种面向连接的可靠地字节流协议 在请求中 这些字节均以%开头 并以十六进制出现 例如%5A%8D
当用户通过浏览器提交一个包含UTF—8编码格式的中文请求时候 浏览器会将一个中文字符转化为三个字节(一般一个utf-8汉字占三个字节)
即形成三个类似%5A的字节表示形式 并将这三个字节上传给Tomcat服务器 Tomcat接收到字节后 并不知道他源底层采用什么字符编码 Tomcat默认使用的格式ISO-8859-1 这个格式不支持中文 所以会将字节按照这个方式编码 显示出来就会是乱码
写在servlet中或者过滤器中 当你接收到请求后进行格式更改
post:设置setCharacterEncoding()设置请求中 中文的字符编码
注意:这个只解决post 不能解决get 因为get提交的中文是通过url提交的 不在请求正文中
get:在Tomcat9之后的版本解决了这个问题
但是9前还要设置
在servlet中将你的中文打散再组装
//获取你的name 其编码格式为ISO8859-1 String name = request.getParamter("name"); //打散:将name字符串按照原编码进行打散 byte[] bytes = name.getBytes("ISO8859-1"); //组装:将bytes字节数组按照指定的字符编码进行组装 name = new String (bytes,"utf-8");