请教一个字符编码的问题(unicode)

iammingbohello 2007-09-20 11:37:32

程序如下：
public class CharsetTest {
public static void main(String[] args)
{
String str = new String("好");
byte[] bt = str.getBytes("Unicode");
for(int i=0;i<bt.length;i++)
{
System.out.println(bt[i]);
}
}

以上程序用Unicde字符集解码为字符序列时，会解码成4个字节，Unicode不是两个字节的编码的吗？
如果用GBK解码就没有问题。

请指教，谢谢！

...全文

101 9 打赏收藏转发到动态举报

写回复

用AI写文章

9 条回复

切换为时间正序

请发表友善的回复…

发表回复

南南北北 2007-09-21

打赏
举报

写错了，是使用其他字符编码表示字节数组的时候已经计算过了。

南南北北 2007-09-21

打赏
举报

to: 火龙果

有

没有表示出来的原因可能是java使用UNICODE编码表示字符串，使用其他字符编码表示字符串时已经计算过了。

psyl 2007-09-20

打赏
举报

norwolfli 解释的很到位，学习了

火龙果被占用了 2007-09-20

打赏
举报

to: norwolfl

那 GBK、UTF-8 之类的编码就没有这种问题吗？

sea_force 2007-09-20

打赏
举报

学习...

南南北北 2007-09-20

打赏
举报

补充下楼上的。

big endian和little endian是CPU处理多字节数的不同方式。例如“汉”字的Unicode编码是6C49。那么写到文件里时，究竟是将6C写在前面，还是将49写在前面？如果将6C写在前面，就是big endian。还是将49写在前面，就是little endian。

前面多的FFFE或者FEFF就表示高字节在前还是低字节在前。

火龙果被占用了 2007-09-20