URLEncodedUtils.parse()处理中文有错误？

u010630804 2014-01-07 05:27:50

相关代码如下

    private static String urlDecode(

            final String content,

            final Charset charset,

            final boolean plusAsBlank) {

        if (content == null) {

            return null;

        }

        final ByteBuffer bb = ByteBuffer.allocate(content.length());

        final CharBuffer cb = CharBuffer.wrap(content);

        while (cb.hasRemaining()) {

            final char c = cb.get();

            if (c == '%' && cb.remaining() >= 2) {

                final char uc = cb.get();

                final char lc = cb.get();

                final int u = Character.digit(uc, 16);

                final int l = Character.digit(lc, 16);

                if (u != -1 && l != -1) {

                    bb.put((byte) ((u << 4) + l));

                } else {

                    bb.put((byte) '%');

                    bb.put((byte) uc);

                    bb.put((byte) lc);

                }

            } else if (plusAsBlank && c == '+') {

                bb.put((byte) ' ');

            } else {

                bb.put((byte) c);

            }

        }

        bb.flip();

        return charset.decode(bb).toString();

    }

11行获取从QueryString中获取一个字符，在java中，这可能是一个Unicode多字节字符。在27行，把这个字符强制转换成byte，就丢字节了。
偏偏这个方法就是用来做字符集转码的。会犯这么低级的错误吗？请高手讲讲

...全文

1315 2 打赏收藏转发到动态举报

写回复

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

花谢尊前不敢香 2014-01-08

打赏
举报

回复

这就是盲目问问题的例子。

u010630804 2014-01-07

打赏
举报

回复

好吧，我理解了。这个方法要求参数是已经URL编码的串，也就是说汉字已经转换成了%XX，直接出现的汉字应该不在考虑范围。

地址栏中出现汉字的情况有两种，一种是汉字出现在URL的路径部分，一种是汉字出现在URL的传参的部分，第二种情况的时候必须采用编码后传参，接受时解码的方式完成传参。js中编码有escape(),encodeURI(),encodeURIComponent()三个常用的方法，escape()常常用在提交页面和处理页面的编码格式相同的情况下（比如它们都是GB2312），encodeURI()和encod

使用 tomcat 时，相信大家都回遇到中文乱码的问题，具体表现为通过表单取得的中文数据为乱码。一、初级解决方法通过一番检索后，许多人采用了如下办法，首先对取得字符串按照 iso8859-1 进行解码转换，然后再按照 gb2312 进行编码，最后得到正确的内容。示例代码如下： http://xxx.do?ptname='我是中国人' String strPtname = request.ge

HttpClient 教程 (一) 前言超文本传输协议（HTTP）也许是当今互联网上使用的最重要的协议了。Web服务，有网络功能的设备和网络计算的发展，都持续扩展了HTTP协议的角色，超越了用户使用的Web浏览器范畴，同时，也增加了需要HTTP协议支持的应用程序的数量。尽管java.net包提供了基本通过HTTP访问资源的功能，但它没有提供全面的灵活性和其

当客户端不支持调用jackson转换处理response数据时,报406错误。此时可以手动反序列化为一个string串。 406问题：方案一、在服务端手动转json,返回一个字符串。方案二.、当url 后缀为html,是不能返回json数据的。需要在web.xml改后缀。乱码问题： 1、 httpClient客户端,在设置实体前设置实体内容的编码。

为什么80%的码农都做不了架构师？>>> ...

62,623

社区成员

307,257

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章