社区
汇编语言
帖子详情
关于字符编码的基本问题
jara
2006-05-01 09:50:41
我在一个记事本里写了个字母a
然后以UTF-16存盘,然后debug这个记事本
发现是61 00,请问为什么不是00 61呢?而且汉字好像也是反过来的
是因为汇编里按相反顺序存放数据吗?
可是用其他编码如GB2312存放比如汉字‘是“,就是CA C7
是顺序存放的。为什么啊?请教高手
...全文
86
4
打赏
收藏
关于字符编码的基本问题
我在一个记事本里写了个字母a 然后以UTF-16存盘,然后debug这个记事本 发现是61 00,请问为什么不是00 61呢?而且汉字好像也是反过来的 是因为汇编里按相反顺序存放数据吗? 可是用其他编码如GB2312存放比如汉字‘是“,就是CA C7 是顺序存放的。为什么啊?请教高手
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
jara
2006-05-01
打赏
举报
回复
结贴,刚才我存错了编码
经过试验,UTF-16也是顺序存放的!
NuclearG
2006-05-01
打赏
举报
回复
对刚才的bug打个补丁~~ unicode是四个字节 就是一次要读一个 dword
NuclearG
2006-05-01
打赏
举报
回复
这很好理解 用 ansi 写中文的话 即楼主提到的 GB2312 每个文字是被分成两个扩展ASCII来存放的 就是两个字节 而在计算机看来这两个字节在本质上没有联系 只是两个独立的字节 并不是一个完整的字 所以没有理由用小结尾方式倒过来存放 同样在读取这种东西的时候也是一个字节一个字节地取 如果取到的那个字节符号位为1 即表明它是个扩展ASCII 那就把它后面的字节也一并取了来分析 而并不是一次取一个字 那是UNICODE的作法
而用utf16的话每个文字都是占了一个字 在存放的时候当然要把两个字节倒过来了
pig4210
2006-05-01
打赏
举报
回复
因为我是win2000,记事本里没有UTF-16这个编码的存放方式,但我想既然如你所说它的存放顺序是相反的,那么我们可以推定它是以16个bit也就是word的形式存放数据的。而自然word在内存中的形式存放也就被照搬到磁盘上去了。
还有就是如果以ANSI编码的话,的确是顺序存放,比如alt+97(61h)存放去“a”或alt+51911(CAC7h)输入“是”一样,在debug里都是顺序的。
这是我的理解。
emoji图片和
编码
表
467个emoji的文件和
编码
表数据 包括Unicode
编码
,UTF8
编码
,UTF16
编码
,SBUnicode
编码
java base64的jar包
http://blog.csdn.net/yx0628/article/details/9633947 这个是gps转百度地图坐标的相关介绍。
字符
集和
字符
编码
常见
字符
集及
编码
基本
概念
字符
(Character) 是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。
字符
集(Character set) 是一个系统支持的所有抽象
字符
的集合。通常以二维表的形式存在,二维表的内容和大小是由使用者的语言而定。如ASCII,GBxxx,Unicode等。
字符
编码
(Character encoding) 是把
字符
集中的
字符
编码
为特定的二进制数,以便在计算机中存储。每个
字符
集中的
字符
都对应一个唯一的二进制
编码
。
字符
集和
字符
编码
一般都是成对出现的,如AS
C++与
字符
集、
字符
编码
目录
问题
字符
集
字符
编码
字符
集与
字符
编码
的关系 多种
字符
编码
存在的意义
字符
编码
的发展历史 活动代码页 c++的多字节
字符
与宽字节
字符
c++的多字节
字符
串与宽字节
字符
串 C++程序输出
字符
串的
编码
字符
串常量 参考文章
问题
字符
集和
编码
往往是IT菜鸟甚至是各种大神的头痛
问题
。当遇到纷繁复杂的
字符
集,各种火星文和乱码时,
问题
的定位往往变得非常困难。本...
字符
编码
。
目录 一、什么是
字符
编码
二、
字符
编码
的种类 三、每种
字符
编码
的详解 四、总结 一、什么是
字符
编码
字符
编码
(Character Encoding):
字符
编码
是指一种映射规则,根据这个映射规则可以将 某个
字符
映射成其他形式的数据以便在计算机中存储和传输。 例如ASCII
字符
编码
规定使用 单字节中低位的7个比特去
编码
所有的
字符
,在这个
编码
规则下字母A的编号是65 (ASCII码),用单字节...
汇编语言
21,496
社区成员
41,617
社区内容
发帖
与我相关
我的任务
汇编语言
汇编语言(Assembly Language)是任何一种用于电子计算机、微处理器、微控制器或其他可编程器件的低级语言,亦称为符号语言。
复制链接
扫一扫
分享
社区描述
汇编语言(Assembly Language)是任何一种用于电子计算机、微处理器、微控制器或其他可编程器件的低级语言,亦称为符号语言。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章