关于多语言编码的一个问题,大神来看,unicode ,codepage相关

Uncle_higo 2017-12-07 09:57:09
遇到一些文本串,都是双字节编码,并且已知是波兰语,和英文字母相同的部分就是 以ansi 码加 0x00构成一个字符,遇到特殊字符,则有特定编码,我想知道这到底是哪一种编码方式,我以为是unicode,但好像不是
下面是例子

字符 Połączenia

编码 50 00 / 6f 00 / 42 01 / 05 01/ 63 00/ 7a 00/65 00 /6e 00 /69 00 /61 00


我对unicode理解并不是太深,目前理解为任何一个语言的特殊字符都在unicode里有唯一的编码,所以我试图去通过unicode转字符的软件验证我的想法,但是 42 01 转出来的是 汉字 “䈁” ,而不是波兰语的特殊符号


所以,请教大家,这样怎么判断他的编码方式呢
...全文
200 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
paschen 版主 2017-12-07
  • 打赏
  • 举报
回复
Uncle_higo 2017-12-07
  • 打赏
  • 举报
回复
我刚才无意试着保存成utf-16竟然可以了,其实按理双字节的编码也就unicode 和utf 16吧? 竟然一直没想到那上面。 也谢谢楼上两位,都给你们吧
zhanghuaichao 2017-12-07
  • 打赏
  • 举报
回复
我没有用过波兰语这种转化,但是应该是ANSI本地化的时候,产生的,就行中国的GBK编码,在简体中文操作系统中会带两个函数,MultiByteToWideChar和WideCharToMultiByte这两个函数用来从多字节的GBK,到unicode16小端模式进行转化。我刚开始研究编码的时候,用的是UE的编辑器,然后能设置代码页,也可以转化为相应的编码格式,你可以看看用这个软件能否帮助到你。

64,654

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧