关于多语言编码的一个问题,大神来看,unicode ,codepage相关
遇到一些文本串,都是双字节编码,并且已知是波兰语,和英文字母相同的部分就是 以ansi 码加 0x00构成一个字符,遇到特殊字符,则有特定编码,我想知道这到底是哪一种编码方式,我以为是unicode,但好像不是
下面是例子
字符 Połączenia
编码 50 00 / 6f 00 / 42 01 / 05 01/ 63 00/ 7a 00/65 00 /6e 00 /69 00 /61 00
我对unicode理解并不是太深,目前理解为任何一个语言的特殊字符都在unicode里有唯一的编码,所以我试图去通过unicode转字符的软件验证我的想法,但是 42 01 转出来的是 汉字 “䈁” ,而不是波兰语的特殊符号
所以,请教大家,这样怎么判断他的编码方式呢