社区
Java
帖子详情
usc2 转 gbk 特殊字
694850337
2011-01-24 11:01:40
我用USC2类型的字节转gbk(String)时候后缀为什么存不进去如下:
要转变的Sting: 长短
ucs2字节: 957f77ed
用gbk转换后的ucs2字节:3f773f
String aa="长短";
byte[] changaa = aa.getBytes("UnicodeBigUnmarked");
String allchangaa = new String(changaa,"gbk");
如何解决ucs2字节改变的问题求高人指教
...全文
286
8
打赏
收藏
usc2 转 gbk 特殊字
我用USC2类型的字节转gbk(String)时候后缀为什么存不进去如下: 要转变的Sting: 长短 ucs2字节: 957f77ed 用gbk转换后的ucs2字节:3f773f String aa="长短"; byte[] changaa = aa.getBytes("UnicodeBigUnmarked"); String allchangaa = new String(changaa,"gbk"); 如何解决ucs2字节改变的问题求高人指教
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
emilyhonglin
2011-12-13
打赏
举报
回复
怎么解决的?
694850337
2011-01-25
打赏
举报
回复
问题解决啦! 分还是要给的
694850337
2011-01-24
打赏
举报
回复
[Quote=引用 4 楼 ml_dark 的回复:]
即使有这种要求,那你也只有在
byte[] changaa = aa.getBytes("UnicodeBigUnmarked");这个之后,将其字节值转换成GBK模式下的字节值,要不然绝对是乱码
[/Quote]
因为他们那里接收到之后是先用gbk转后得到usc2字节 然手在用UnicodeBigUnmarked转String就ok啦
gbk只是传送的一个通道
ml_dark
2011-01-24
打赏
举报
回复
即使有这种要求,那你也只有在
byte[] changaa = aa.getBytes("UnicodeBigUnmarked");这个之后,将其字节值转换成GBK模式下的字节值,要不然绝对是乱码
694850337
2011-01-24
打赏
举报
回复
[Quote=引用 1 楼 ml_dark 的回复:]
编码类型不同,长度肯定不同,你给的代码,是将UCS2转换成 GBK,其编码方式不同,出来的字节值是在GBK模式下市乱码,造成出来的最后结果是乱码。。
UCS2只能用UCS2来转换,不知道你为什么有这么奇怪的需求
[/Quote]
合作方就是这么解码的,我也很郁闷 有没有在它们转变过程中可以将
by[0] = (byte)0xe1;
这样的编码存入gbk中且不乱码的方法
694850337
2011-01-24
打赏
举报
回复
合作方就是这么解码的,我也很郁闷 有没有在它们转变过程中可以将
by[0] = (byte)0xe1;
这样的编码存入gbk中且不乱码的方法
ml_dark
2011-01-24
打赏
举报
回复
编码类型不同,长度肯定不同,你给的代码,是将UCS2转换成 GBK,其编码方式不同,出来的字节值是在GBK模式下市乱码,造成出来的最后结果是乱码。。
UCS2只能用UCS2来转换,不知道你为什么有这么奇怪的需求
火龙果被占用了
2011-01-24
打赏
举报
回复
谁跟你说这编码可以这样进行转换的?
如果没有编码字符映射表,是没有办法转换的。
php中
usc2
编码,规则编码说明
标签: [编码][/编码]--通常,中文网站的编码只需要测试这4中,“
gbk
、utf8、gb2312
转
utf8”,部分是\u9a8c是这样的,需要用编码“
usc2
”;--如果还是不行,那查看一下协议头中是否有编码设置,如果有也设置一下。常用编码1:
gbk
--如:%C9%F1%C6%F7 或 中文 (包含gb2312)常用编码2: utf8 ...
编码格式科普ASCII unicode utf-8 usc-2 GB2312
3.unicode (以及升级版的usc-2和utf-8)一种全球化的标准
字
符码,包含了全世界所有的语言、文
字
、符号,usc-2和utf-8为unicode的升级版。usc-2用16位(16比特)(16bit)(2b)(2byte)(2
字
节)表示一个
字
符,最多可以表示2的16次方个
字
符,即65535个
字
符。utf-8是usc-2的升级版(包含usc-2的所有
字
符,向下兼容),用1-4个
字
节表示一个
字
符,即最多表示4个byte即2的32次方=4294967296(十进制)个数
字
。
unicode ucs2 utf16 utf8 ansi
GBK
GB2312 互
转
及 渲染
unicode ucs2 utf16 utf8 ansi 编码
中文
字
符编码 GB2312
GBK
GB18030 BIG5 UNICODE UTF8 UTF16 UTF-32 USC-2 UCS-4
信息交换用汉
字
编码
字
符集·基本集 GB2312 概述 GB 2312或GB 2312-80是中国国家标准简体中文
字
符集,全称《信息交换用汉
字
编码
字
符集·基本集》,又称GB0 GB 2312标准共收录6763个汉
字
,其中一级汉
字
3755个,二级汉
字
3008个;同时收录了包括拉丁
字
母、希腊
字
母、日文平假名及片假名
字
母、俄语西里尔
字
母在内的682个
字
符。 GB 2312的出现,基本满足了汉...
ANSI、ASCII、UTF-8、UNICODE、UCS-2、
GBK
区别与联系
ANSI编码 ANSI(American National Standards Institute—美国国家标准学会) 因为地区的不同,不同国家编码
字
符的标准也是不一样的,这就导致了GB2312、
GBK
、Big5、Shift_JIS 等各自的编码标准的产生。例如:在简体中文Windows操作系统中,ANSI 编码代表
GBK
编码;在日文Windows操作系统中,ANSI 编码代表 Shift_J...
Java
50,545
社区成员
85,620
社区内容
发帖
与我相关
我的任务
Java
Java相关技术讨论
复制链接
扫一扫
分享
社区描述
Java相关技术讨论
java
spring boot
spring cloud
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章