Unicode 和 UTF-8 的区别和联系?

AntonlioX 2005-10-26 03:12:04
rt
...全文
1199 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
BreaKing 2005-10-29
  • 打赏
  • 举报
回复
UTF-8是可以用於真正的流式傳輸的,Unicode是一種編碼方案
我的理解是UTF-8是Unicode的一種具體實現
類似的實現還有UTF-16等等
wshcdr 2005-10-29
  • 打赏
  • 举报
回复
UTF-8也是UNICODE的一种吧
  • 打赏
  • 举报
回复
utf8 和 utf16 的转换是很简单地. 0 - 0x7f 的1字节不变, 0x80 - 0x7ff 的转成2字节, 为 110xxxxx 10xxxxxx , 0x800 - 0xffff 的转成3字节, 结果为 1110xxxx 10xxxxxx 10xxxxxx
wohow 2005-10-26
  • 打赏
  • 举报
回复
微软的宽字符函数(一般是wchar_t作参数的)用UCS2,Linux用UCS4,很少见到支持UTF8的函数,只在Java中见过
finytang 2005-10-26
  • 打赏
  • 举报
回复
其实还是不是很清楚
记得以前用linux的时候,UTF-8的显示都是乱码
不用就好了

学了很久,可以到CSDN上来了
AntonlioX 2005-10-26
  • 打赏
  • 举报
回复
那实际编程的时候所用的是UTF-8 还是 Unicode? 我刚接触这个 不太了解。

我看msdn上的那些关于unicode的函数 好像不是按照UTF-8 来实现的阿?
xuzheng318 2005-10-26
  • 打赏
  • 举报
回复
Unicode的最初目标,是用1个16位的编码来为超过65000字符提供映射。但这还不够,它不能覆盖全部历史上的文字,也不能解决传输的问题(implantation head-ache's),尤其在那些基于网络的应用中。已有的软件必须做大量的工作来程序16位的数据。
因此,Unicode用一些基本的保留字符制定了三套编码方式。它们分别是UTF-8,UTF-16和UTF-32。正如名字所示,在UTF-8中,字符是以8位序列来编码的,用一个或几个字节来表示一个字符。这种方式的最大好处,是UTF-8保留了ASCII字符的编码做为它的一部分,例如,在UTF-8和ASCII中,“A”的编码都是0x41.
UTF-16和UTF-32分别是Unicode的16位和32位编码方式。考虑到最初的目的,通常说的Unicode就是指UTF-16。在讨论Unicode时,搞清楚哪种编码方式非常重要。Unicdoe相关的技术介绍参见http://www.unicode.org/unicode/standard/principles.html.

24,854

社区成员

发帖
与我相关
我的任务
社区描述
C/C++ 工具平台和程序库
社区管理员
  • 工具平台和程序库社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧