对编码不慎了解,请教一个编码问题!!!

ivan_070 2014-07-23 08:55:31
系统有点特殊,是一个充值系统,需要跟另外两个平台接入。
平台A付款后调用我们的平台,我们处理一些逻辑后,需要在调用平台B。
A、B都是第三方的,A是gbk编码、B是utf-8编码。
起初我们也用utf-8编码,但是A平台的传递参数经过urlencode("gbk")之后,怎么能在utf-8系统中不乱码。
例如:“我”——%CE%D2 这个是urlencode的gbk,如果tomcat设置编码是utf-8之后,这个参数应该怎么编码才能获取。

如果将tomcat设置为默认的iso_8859_1,通过 new String(aaa.getBytes("iso_8859_1"),"gbk");倒是可以解码,但是这样导致我们系统中所有get方法的参数都要这样解码,请问有没有什么办法解决。
...全文
423 20 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
20 条回复
切换为时间正序
请发表友善的回复…
发表回复
ivan_070 2014-07-29
  • 打赏
  • 举报
回复
所以得到一个结论,不要轻易修改tomcat的编码,改了之后自己用起来方便,一旦需要跟其他系统交互会出现麻烦问题。 最好还是默认iso_8859_1
骑士的崛起 2014-07-25
  • 打赏
  • 举报
回复
引用 楼主 ivan_070 的回复:
系统有点特殊,是一个充值系统,需要跟另外两个平台接入。 平台A付款后调用我们的平台,我们处理一些逻辑后,需要在调用平台B。 A、B都是第三方的,A是gbk编码、B是utf-8编码。 起初我们也用utf-8编码,但是A平台的传递参数经过urlencode("gbk")之后,怎么能在utf-8系统中不乱码。 例如:“我”——%CE%D2 这个是urlencode的gbk,如果tomcat设置编码是utf-8之后,这个参数应该怎么编码才能获取。 如果将tomcat设置为默认的iso_8859_1,通过 new String(aaa.getBytes("iso_8859_1"),"gbk");倒是可以解码,但是这样导致我们系统中所有get方法的参数都要这样解码,请问有没有什么办法解决。
你既然知道这个问题是怎么解决,就应该直接在2个系统交互的地方直接修改就好。 我处理过一个类似情况,手机客户端HTTP调用A服务器,A服务器HTTP调用B服务器。客户端和A之间是UTF-8,无论B编码是什么,我只要保证A从B的得到的数据不是乱码客户端得到数据就没问题。 像你所说的情况只要先把流按iso_8859_1获取,再按gbk转化下,得到的数据就是正常的,在把数据返回给调用http的代码。 解决方案的关键是你的A,B服务器交互方式是什么,在交互的地方修改下就好,希望我的例子给你启发。
ivan_070 2014-07-25
  • 打赏
  • 举报
回复
引用 17 楼 csucaicai 的回复:
[quote=引用 2 楼 ivan_070 的回复:] [quote=引用 1 楼 csucaicai 的回复:] 加密吧,例如:都用byte64编码,之后统一再转码回来~!
平台返回的数据,不能修改了。[/quote] 不是让你修改,是加密再解密,保证数据的一致性啊,中文乱转是不行的[/quote] 你给tomcat设置utf-8编码后,get方法的参数在tomcat中就已经用utf8编码decode了。已经是一个乱码了。
balabala_sean 2014-07-24
  • 打赏
  • 举报
回复
写一个适配器
大白@木禾木 2014-07-24
  • 打赏
  • 举报
回复
平台A和你交互,你和平台B交互,所以你得设置为GBK的,然后调用B的时候使用utf8才行。
a137655624 2014-07-24
  • 打赏
  • 举报
回复
除了new String更改编码集别 别无他法,。。。。。。。。。。。。。。我也真挺佩服的,,现在居然还有用GBK编码的
ivan_070 2014-07-24
  • 打赏
  • 举报
回复
顶一下,求高手指点!
csucaicai 2014-07-24
  • 打赏
  • 举报
回复
引用 2 楼 ivan_070 的回复:
[quote=引用 1 楼 csucaicai 的回复:] 加密吧,例如:都用byte64编码,之后统一再转码回来~!
平台返回的数据,不能修改了。[/quote] 不是让你修改,是加密再解密,保证数据的一致性啊,中文乱转是不行的
ivan_070 2014-07-24
  • 打赏
  • 举报
回复
引用 15 楼 yanghongjy 的回复:
[quote=引用 13 楼 yanghongjy 的回复:] utf-8->gbk URLDecoder.decode(URLEncoder.encode(str,"gbk"),"gbk") com.apache.commons.io.IOUtils gbk->utf-8 String utf8String = IOUtils.toString(IOUtils.toInputStream(gbkString, "UTF-8"));
你看怎么样? [/quote] 估计不行了,gbk和utf的字节数不一样了,估计不可逆的吧。
yanghongjy 2014-07-24
  • 打赏
  • 举报
回复
引用 13 楼 yanghongjy 的回复:
utf-8->gbk URLDecoder.decode(URLEncoder.encode(str,"gbk"),"gbk") com.apache.commons.io.IOUtils gbk->utf-8 String utf8String = IOUtils.toString(IOUtils.toInputStream(gbkString, "UTF-8"));
你看怎么样?
ivan_070 2014-07-24
  • 打赏
  • 举报
回复
引用 11 楼 yanghongjy 的回复:
转换方法 public byte[] gbk2utf8(String chenese){ char c[] = chenese.toCharArray(); byte [] fullByte =new byte[3*c.length]; for(int i=0; i<c.length; i++){ int m = (int)c[i]; String word = Integer.toBinaryString(m); StringBuffer sb = new StringBuffer(); int len = 16 - word.length(); //补零 for(int j=0; j<len; j++){ sb.append("0"); } sb.append(word); sb.insert(0, "1110"); sb.insert(8, "10"); sb.insert(16, "10"); String s1 = sb.substring(0, 8); String s2 = sb.substring(8, 16); String s3 = sb.substring(16); byte b0 = Integer.valueOf(s1, 2).byteValue(); byte b1 = Integer.valueOf(s2, 2).byteValue(); byte b2 = Integer.valueOf(s3, 2).byteValue(); byte[] bf = new byte[3]; bf[0] = b0; fullByte[i*3] = bf[0]; bf[1] = b1; fullByte[i*3+1] = bf[1]; bf[2] = b2; fullByte[i*3+2] = bf[2]; } return fullByte; }
这个方法不行。 String s = "%CE%D2"; s = java.net.URLDecoder.decode(s, "utf-8"); 只要能把s转码成功就行了。
yanghongjy 2014-07-24
  • 打赏
  • 举报
回复
com.apache.commons.io.IOUtils utf-8->gbk URLDecoder.decode(URLEncoder.encode(str,"gbk"),"gbk") gbk->utf-8 String utf8String = IOUtils.toString(IOUtils.toInputStream(gbkString, "UTF-8"));
ivan_070 2014-07-24
  • 打赏
  • 举报
回复
引用 10 楼 jimmy609 的回复:
呵呵,和楼主遇到一样的问题,对方平台是GBK,我这边是utf-8,他表单提交过来的中文为乱码,我刚发了个帖子,目前还没解决, 帮顶了.....
同命相怜啊。
yanghongjy 2014-07-24
  • 打赏
  • 举报
回复
转换方法 public byte[] gbk2utf8(String chenese){ char c[] = chenese.toCharArray(); byte [] fullByte =new byte[3*c.length]; for(int i=0; i<c.length; i++){ int m = (int)c[i]; String word = Integer.toBinaryString(m); StringBuffer sb = new StringBuffer(); int len = 16 - word.length(); //补零 for(int j=0; j<len; j++){ sb.append("0"); } sb.append(word); sb.insert(0, "1110"); sb.insert(8, "10"); sb.insert(16, "10"); String s1 = sb.substring(0, 8); String s2 = sb.substring(8, 16); String s3 = sb.substring(16); byte b0 = Integer.valueOf(s1, 2).byteValue(); byte b1 = Integer.valueOf(s2, 2).byteValue(); byte b2 = Integer.valueOf(s3, 2).byteValue(); byte[] bf = new byte[3]; bf[0] = b0; fullByte[i*3] = bf[0]; bf[1] = b1; fullByte[i*3+1] = bf[1]; bf[2] = b2; fullByte[i*3+2] = bf[2]; } return fullByte; }
咖啡加糖_ 2014-07-24
  • 打赏
  • 举报
回复
呵呵,和楼主遇到一样的问题,对方平台是GBK,我这边是utf-8,他表单提交过来的中文为乱码,我刚发了个帖子,目前还没解决, 帮顶了.....
yanghongjy 2014-07-24
  • 打赏
  • 举报
回复
public byte[] gbk2utf8(String chenese){ char c[] = chenese.toCharArray(); byte [] fullByte =new byte[3*c.length]; for(int i=0; i<c.length; i++){ int m = (int)c[i]; String word = Integer.toBinaryString(m); // System.out.println(word); StringBuffer sb = new StringBuffer(); int len = 16 - word.length(); //补零 for(int j=0; j<len; j++){ sb.append("0"); } sb.append(word); sb.insert(0, "1110"); sb.insert(8, "10"); sb.insert(16, "10"); // System.out.println(sb.toString()); String s1 = sb.substring(0, 8); String s2 = sb.substring(8, 16); String s3 = sb.substring(16); byte b0 = Integer.valueOf(s1, 2).byteValue(); byte b1 = Integer.valueOf(s2, 2).byteValue(); byte b2 = Integer.valueOf(s3, 2).byteValue(); byte[] bf = new byte[3]; bf[0] = b0; fullByte[i*3] = bf[0]; bf[1] = b1; fullByte[i*3+1] = bf[1]; bf[2] = b2; fullByte[i*3+2] = bf[2]; } return fullByte; }
ivan_070 2014-07-24
  • 打赏
  • 举报
回复
原理我重新描述一下,平台A是GBK编码,参数都是urlencode.encode(s,"gbk"),tomcat设置utf8编码之后,参数会自动调用urldecode.decode(s,"utf-8"),这时已经是乱码了。 要解决的问题就是下面的代码 String s = "我"; s = urlencode.encode(s,"gbk");//这里是A平台的参数 s = urlencode.decode(s,"utf-8");//这里是tomcat设置为utf-8编码后 //下面用什么代码能让字符串s不是乱码 平台A、B都不是我们控制的,所以编码不能改。 我们用GBK是可以,但是会影响很大,所以请教一下高手,urlencode.decode编码错了,还能还原吗?
shmy110 2014-07-24
  • 打赏
  • 举报
回复
要不,web.xml里配置个字符拦截器试试?这样项目一启动,自动拦截所有请求路径,转换编码。 <filter> <filter-name>encodingFilter</filter-name> <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class> <init-param> <param-name>encoding</param-name> <param-value>UTF-8</param-value> </init-param> <init-param> <param-name>forceEncoding</param-name> <param-value>true</param-value> </init-param> </filter>
csucaicai 2014-07-23
  • 打赏
  • 举报
回复
加密吧,例如:都用byte64编码,之后统一再转码回来~!
ivan_070 2014-07-23
  • 打赏
  • 举报
回复
引用 1 楼 csucaicai 的回复:
加密吧,例如:都用byte64编码,之后统一再转码回来~!
平台返回的数据,不能修改了。