关于中文简体汉字用unicode存储的问题
//编码
String s = "中国";
//结果输出长度为6
byte[] arr = s.getBytes("unicode");
System.out.println("unicode,length:" + arr.length);
System.out.println(Arrays.toString(arr));
String result = new String(arr,"unicode");
System.out.println(result);
输出结果:
unicode,length:6
[-2, -1, 78, 45, 86, -3]
中
在这里,曾一度让我以为每个汉字是占3个字节,尽管书上说只占两个字节。但是只写入一个汉字 “好” 时:
输出结果:
unicode,length:4
[-2, -1, 89, 125]
好
这时候发现确实应该是占了两个字节,【-2,-1】应该是某个东西,并且是隐形的。以为是换行,但是这个应该不会是负数,而且应该是在末尾显示。所以不知道-2,-1是什么意思?
谢谢!