utf-8 编码的问题
为什么说utf-8是单字节编码,有些字符需要使用2字节或者3字节才能表示,对于多字节应该有字节顺序的问题,为什么utf-8不像utf-16那样有这个问题。
uft-8编码规则:
1字节 0000-007f 0xxxxxxx
2字节 0080-07ff 110xxxxx10xxxxxx
3字节 0800-FFFF 1110xxxx10xxxxxx10xxxxxx
是不是这样理解:每个字节都有特定的位,如1110,110,10,单字节编码也就是这个意思。通过这个可以区分字节顺序,比如3字节1110XXXXX肯定在最前面。