windows 2字节的unicode怎么表示全部字符？

callmew 2019-02-21 10:28:05

unicode想要表示世界上所有字符需要用四个字节（因为unicode没有长度标记位），缺点是每个字符都要用四个字节
UTF-8也是可以表示世界上所有字符，但是好处是大部分字符只需要一两个字节就能表示
那么Windows内核中 unicode的长度是两个字节，怎么表示那些占3 4 个字节的中文？

...全文

242 5 打赏收藏转发到动态举报

写回复

5 条回复

切换为时间正序

请发表友善的回复…

发表回复

godspeed_g 2019-02-27

打赏
举报

回复

我觉得题主可以参考这篇文章
https://blog.csdn.net/kemaWCZ/article/details/50749209
Windows使用的UTF-16其实是变长的，大部分使用2字节，但也可以用4字节。这个问题的细节确实很麻烦。特别是判断一个字符串里面究竟有几个字符的时候，不能简单的根据字符串占用的空间计算出来。

callmew 2019-02-27

打赏
举报

回复

引用 4 楼 godspeed_g 的回复:

我觉得题主可以参考这篇文章 https://blog.csdn.net/kemaWCZ/article/details/50749209 Windows使用的UTF-16其实是变长的，大部分使用2字节，但也可以用4字节。这个问题的细节确实很麻烦。特别是判断一个字符串里面究竟有几个字符的时候，不能简单的根据字符串占用的空间计算出来。

十分感谢！

threenewbee 2019-02-21

打赏
举报

回复

UTF-8也是可以表示世界上所有字符，但是好处是大部分字符只需要一两个字节就能表示看清楚，是大部分字符，不是所有字符。不能用1、2字节表示的，就用3、4字节。

threenewbee 2019-02-21

打赏
举报

回复

引用 2 楼 callmew 的回复:

你说的这个我知道，但是我的问题是，为什么windows内核编码是2字节的unicode，但是我们平时使用时依然可以使用到全部的汉字（包括3-4个字节的字符）
所以要不就是windows内核编码其实是4个字节的unicode
不然就是windows有其他的处理方式，

你一会unicode一会儿utf，你在说什么

callmew 2019-02-21

打赏
举报

回复

你说的这个我知道，但是我的问题是，为什么windows内核编码是2字节的unicode，但是我们平时使用时依然可以使用到全部的汉字（包括3-4个字节的字符）
所以要不就是windows内核编码其实是4个字节的unicode
不然就是windows有其他的处理方式，

在该属性中选择"使用多字节字符集"或者"使用Unicode字符集" 本代码段均可处理 #include <string> #include <iostream> #ifdef _WIN32 #include <windows.h> std::string WcharToC

我们常说的这句话“Unicode字符是2个字节”这句话有毛病 Unicode目前规划的总空间有17个平面， 0x0000---0x10FFFF,每个平面有 65536 个码点. Unicode支持的字符上限是65536个这句话也是有问题的，这65536个字符是...

：UTF-8是一种变长编码，它使用1到4个字节来表示不同的Unicode字符。UTF-8编码可以表示Unicode字符集中的所有字符，包括ASCII字符集。使用Unicode字符集和相应的编码方式，开发人员可以处理和显示多语言文本，确保在...

ANSI（双字节内码）：能够支持65000个字符编码，中文简体编码 GB2312 实际上是 ANSI 的一个代码页，不同的代码页的内码无法再其他代码中正常显示，日中文/繁体中文/简体中文使用了不同的代码页...

vs配置选项“使用多字节字符集”和“使用Unicode字符集”的区别 VS集成开发环境，字符集选择“使用多字节字符集”和“使用Unicode字符集”的直接区别就是：编译器是否增加了宏定义——UNICODE。当选择“使用Unicode...

6,850

社区成员

178,035

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章