UCS的全称到底是什么啊,搜到2个答案

winner8080 2008-01-03 07:45:08
一个曰:Unicode 的编码方式与 ISO 10646 的通用字符集(Universal Character Set,UCS)概念相对应

另一个云:Unicode的学名是"Universal Multiple -Octet Coded Character Set",简称为UCS。UCS可以看作是"Unicode Character Set"的缩写。

谁有标准的说法吗,
如果UCS不是unicode,那他们的关系又是什么呢
...全文
922 9 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
JohnTitor 2008-01-06
  • 打赏
  • 举报
回复
UCS的全称是Universal Character Set。
UCS不是Unicode,他们是两个标准。只不过现在这两个标准已经兼容了。
UCS刚开始制定时能够支持20多亿个编码(31-bit),而Unicode刚开始时只能够支持65536个编码(16-bit)。
后来为了使两个标准能够互相兼容,人们找到了一个折中办法,就是扩充Unicode,使Unicode能支持多达
一百多万个编码,而UCS也不再支持20多亿个编码了,而是改成和Unicode一样只支持那
一百多万个编码,UCS 31-bit编码空间中除这一百多万个编码外的其他码值就不用了。
laomai 2008-01-06
  • 打赏
  • 举报
回复
在autocad里ucs是uniform coordinate system的意思,呵呵
CrySleeper 2008-01-04
  • 打赏
  • 举报
回复
楼上正解
CrySleeper 2008-01-04
  • 打赏
  • 举报
回复
我是人类
kobefly 2008-01-04
  • 打赏
  • 举报
回复
楼上正解
angelboy1981 2008-01-03
  • 打赏
  • 举报
回复
国际标准 ISO 10646 定义了 通用字符集 (Universal Character Set, UCS). UCS 是所有其他字符集标准的一个超集. 它保证与其他字符集是双向兼容的. 就是说, 如果你将任何文本字符串翻译到 UCS格式, 然后再翻译回原编码, 你不会丢失任何信息.

UCS 包含了用于表达所有已知语言的字符. 不仅包括拉丁语,希腊语, 斯拉夫语,希伯来语,阿拉伯语,亚美尼亚语和乔治亚语的描述, 还包括中文, 日文和韩文这样的象形文字, 以及 平假名, 片假名, 孟加拉语, 旁遮普语果鲁穆奇字符(Gurmukhi), 泰米尔语, 印.埃纳德语(Kannada), Malayalam, 泰国语, 老挝语, 汉语拼音(Bopomofo), Hangul, Devangari, Gujarati, Oriya, Telugu 以及其他数也数不清的语. 对于还没有加入的语言, 由于正在研究怎样在计算机中最好地编码它们, 因而最终它们都将被加入. 这些语言包括 Tibetian, 高棉语, Runic(古代北欧文字), 埃塞俄比亚语, 其他象形文字, 以及各种各样的印-欧语系的语言, 还包括挑选出来的艺术语言比如 Tengwar, Cirth 和克林贡语(Klingon). UCS 还包括大量的图形的, 印刷用的, 数学用的和科学用的符号, 包括所有由 TeX, Postscript, MS-DOS,MS-Windows, Macintosh, OCR 字体, 以及许多其他字处理和出版系统提供的字符.

ISO 10646 定义了一个 31 位的字符集. 然而, 在这巨大的编码空间中, 迄今为止只分配了前 65534 个码位 (0x0000 到 0xFFFD). 这个 UCS 的 16位子集称为 基本多语言面 (Basic Multilingual Plane, BMP). 将被编码在 16 位 BMP 以外的字符都属于非常特殊的字符(比如象形文字), 且只有专家在历史和科学领域里才会用到它们. 按当前的计划, 将来也许再也不会有字符被分配到从 0x000000 到 0x10FFFF 这个覆盖了超过 100 万个潜在的未来字符的 21 位的编码空间以外去了. ISO 10646-1 标准第一次发表于 1993 年, 定义了字符集与 BMP 中内容的架构. 定义 BMP 以外的字符编码的第二部分 ISO 10646-2 正在准备中, 但也许要过好几年才能完成. 新的字符仍源源不断地加入到 BMP 中, 但已经存在的字符是稳定的且不会再改变了.

UCS 不仅给每个字符分配一个代码, 而且赋予了一个正式的名字. 表示一个 UCS 或 Unicode 值的十六进制数, 通常在前面加上 "U+", 就象 U+0041 代表字符"拉丁大写字母A". UCS 字符 U+0000 到 U+007F 与 US-ASCII(ISO 646) 是一致的, U+0000 到 U+00FF 与 ISO 8859-1(Latin-1) 也是一致的. 从 U+E000 到 U+F8FF, 已经 BMP 以外的大范围的编码是为私用保留的.
CrySleeper 2008-01-03
  • 打赏
  • 举报
回复
你去查一下“ISO 10646”不就得了?

印象中ucs编码是unicode的子集,unicode有utf8,utf16,utf32三种编码,而ucs应该只有2-byte和4-byte编码,比较常用的是ucs2(这个应该是utf16的子集)

本人对unicode不甚了解,不能保证上面的第二行话的正确性。
winner8080 2008-01-03
  • 打赏
  • 举报
回复
这个和C#有什么关系呢
我啃 2008-01-03
  • 打赏
  • 举报
回复
Ugly C Sharp
丑陋的C#

33,320

社区成员

发帖
与我相关
我的任务
社区描述
C/C++ 新手乐园
社区管理员
  • 新手乐园社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧