社区
JavaScript
帖子详情
字符编码的问题
hbhbhbhbhb1021
2005-10-24 04:41:52
最近工作闲了,却发现问题变多了
网页上的编码问题,现在脑袋里一团乱,不清晰。请大家帮忙啊
GB2312 两字节,高位的首字符可以判断什么东西拉?忘了。
GBK,比GB2312多一些字。编码是不是也位数多了。
hy,这种编码是什么?
\u4E00这种unicode编码,我怎么发现有些正则里\u这里只有两位
utf-8和utf-16有什么区别。
哪位好心大哥大姐帮我理一理,网页上的编码之间的区别,之间都有什么好处
...全文
171
9
打赏
收藏
字符编码的问题
最近工作闲了,却发现问题变多了 网页上的编码问题,现在脑袋里一团乱,不清晰。请大家帮忙啊 GB2312 两字节,高位的首字符可以判断什么东西拉?忘了。 GBK,比GB2312多一些字。编码是不是也位数多了。 hy,这种编码是什么? \u4E00这种unicode编码,我怎么发现有些正则里\u这里只有两位 utf-8和utf-16有什么区别。 哪位好心大哥大姐帮我理一理,网页上的编码之间的区别,之间都有什么好处
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
9 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
hbhbhbhbhb1021
2005-10-25
打赏
举报
回复
终于明白了,再次谢谢各位
escape和encodeURI都是装成UNICODE
escape函数就是直接的
1110 XXXX 10 XXXXXX 10 XXXXXX
X所组成的二进制的编码
而另一个是包括前面的数字的
hbhbhbhbhb1021
2005-10-25
打赏
举报
回复
终于明白个道理,原来前段时间那个拿汉字首字符的,是把字符转成ASC码,然后加65536,就首字符置1,这样就是gb2312编码了,而这个编码是按字符拼音,音节排序的,所以可以拿出来字符的首字符
hbhbhbhbhb1021
2005-10-25
打赏
举报
回复
谢谢大家,感觉清楚了好多
GB2312 两字节,首字符用来区分ASC码。
GBK,比GB2312多一些字。位数没多
hy,这种编码就是unicode
\u4E00这种unicode编码,正则中只有两位是这样的[^\x00-\xff],原来是没有的意思,并且我也知道为什么这样就可以了
utf-16是8的扩充,并且位数也不一样。
现在还有最后一个问题
escape()函数是把字符串转成unicode
encodeURI这个转成什么东西拉
比如encodeURI("一")
怎么得出了%E4%B8%80这个东西,他unicode编码应该是%u4E00
hbhbhbhbhb1021
2005-10-25
打赏
举报
回复
晕,算错了!
asc 函数执行完是 -11589 加65536的GB2312编码是53947
换成2进制为1110 1111 0001 1011
hbhbhbhbhb1021
2005-10-25
打赏
举报
回复
头又大了,汉字“一”
asc 函数执行完是 -11589 加65536的GB2312编码
13947,我想这个应该是8进制的数,加上首字符的1刚好16位
1001 1111 0001 1011
这个应该是数据在计算机中的存储
UNICODE编码是可变字节 首位有几个字节就几个1然后0,然后每个字节前都是10,剩下的位进行编码
这样就怪了
比如两字节的数据
110 XXXXX 10XXXXXX
剩下的位是11位,怎么可能,这是什么进制的数啊 %u4E00 这是16进制的吧,怎么用JAVA中的str.getBytes()循环得出的居然是两个字节-46,-69
bohemia
2005-10-24
打赏
举报
回复
GBK,GB2312中文编码,属于2字节编码.由最高位的1来区别.;
UNicode属于2字节编码(一般指UCS2).对所有国家的文字进行统一编码.确保所有的编码的唯一性.
UTF-8,(Unicode Transform Format)便于传输Unicode以及处理在Unix上的编码,对Unicode进行转换得到的一种编码方式.
UTF-16对UTF-8的一种扩展.
具体的详细编码介绍可以参考http://search.csdn.net上搜一下.
fantiny
2005-10-24
打赏
举报
回复
然后按照每个概念的关键字去寻找资料,就简单些。
注册表 HKEY_CLASSES_ROOT\MIME\Database\Charset
这里是内码的定义。我用的win2000 pro
butcher2002
2005-10-24
打赏
举报
回复
拣个现成的:)
fantiny
2005-10-24
打赏
举报
回复
http://www.dayu88.net/AboutCode.ppt
我以前给别人讲基本概念,做的一个ppt,很简陋的东西。
你先看看这些基本的概念。按照你的水平应该很容易就搞懂的。
9节课征服「
字符
编码
」
ASCII、GB2312、GBK、GB18030Unicode、UTF-8、UTF-16、UTF-32
使用Filter过滤器解决
字符
编码
问题
Java中的
字符
编码
,默认为:ISO-8859-1(西方
编码
)。这种
编码
方式为单字节码,只支持英文、俄文、葡萄牙文等乱七八糟文,不支持中文。因此,我们需要对JSP页面或者Servlet中进行
字符
编码
集的处理,国际
编码
(UTF-8...
eclipse保存失败/无法保存/
字符
编码
问题
/JAVA
eclipse保存失败/无法保存/
字符
编码
问题
/JAVA在eclipse中单击“保存”按钮时出现如下提示对话内容(框)未能完成保存。原因: 使用“GBK”
字符
编码
时,无法映射某些
字符
。更改
编码
,或者除去“GBK”
字符
编码
不支持...
JAVA中文
字符
编码
问题
详解 控制台输出,
字符
编码
格式转换
JAVA的中文
字符
乱码
问题
一直很让人头疼。特别是在WEB应用中。网上的分析文章和解决方案都很多,但总是针对某些特定情况的...于是下决心好好整理一下中文
字符
编码
问题
,以方便自己记忆,也为其他程序员兄弟们提供一份参
一文搞懂
字符
编码
问题
,从此告别中文乱码
字符
编码
是计算机技术的基石,本文希望帮助大家彻底梳理清楚
字符
编码
问题
,不仅知其然,还知其所以然,摆脱被中文乱码支配的感觉。 在讲解中文
编码
问题
之前,我们需要先讲讲英语
编码
,其解决方案是ASCII。 ASCII ...
JavaScript
87,910
社区成员
224,616
社区内容
发帖
与我相关
我的任务
JavaScript
Web 开发 JavaScript
复制链接
扫一扫
分享
社区描述
Web 开发 JavaScript
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章