一直模模糊糊的UNICODE概念:宽窄字串转换和编码转换的区别?

microyzy 2003-11-21 02:00:22
我一直都不能和清楚地搞清楚关于UNICODE的一些概念,以下这些问题请各位给写答案,哈
1、UNICODE肯定只能用宽字串如unsigned short*来表示,而ascii字符可以用char*、也可以用unsigned short*来表示,对吗?那用unsigned short*表示的ascii(比如英文字符串)是不是其实就是ascii的UNICODE呢?
2、我现在用iconv做编码转换的时候有一些疑问,iconv的函数只接收char*的类型,因此我需要在使用iconv之前把unsigned short*转换为char*
不太理解的是,把unsigned short*转换为char*的函数并不管什么编码,是不是只是把多余的0x00去掉?去掉0x00之后,应该不是UNICODE编码了,iconv怎么能把UNICODE转成别的编码呢(我的是UTF-8到GB2312)
...全文
42 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
microyzy 2003-11-21
  • 打赏
  • 举报
回复
...
newsb 2003-11-21
  • 打赏
  • 举报
回复
1、UNICODE下解释字符串是采用宽字符来解释的,而非UNICODE下解释字符是用单字符来解释的,例如:
'a'在UNICODE下是采用2个字节表示的,而非UNICODE下是用1个字节表示的
'你'在UNICODE下是采用2个字节,非UNICODE下也是2个字节
UNICODE产生本来就是为了解决中文、日文等文字表示的问题

2、在将unsigned short*转换成char*确实只是去掉高8位的0x00
microyzy 2003-11-21
  • 打赏
  • 举报
回复
“把unsigned short*转换为char*的函数” 我 指的是wcstombs()

16,551

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC相关问题讨论
社区管理员
  • 基础类社区
  • Creator Browser
  • encoderlee
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

        VC/MFC社区版块或许是CSDN最“古老”的版块了,记忆之中,与CSDN的年龄几乎差不多。随着时间的推移,MFC技术渐渐的偏离了开发主流,若干年之后的今天,当我们面对着微软的这个经典之笔,内心充满着敬意,那些曾经的记忆,可以说代表着二十年前曾经的辉煌……
        向经典致敬,或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天,我们期待着MFC技术能够恢复其曾经的辉煌,或许这个期待会永远成为一种“梦想”,或许一切皆有可能……
        我们希望这个版块可以很好的适配Web时代,期待更好的互联网技术能够使得MFC技术框架得以重现活力,……

试试用AI创作助手写篇文章吧