再谈字符集

herowach 2008-09-10 09:58:27
一直对字符集都理解的不是很清楚,有时候遇到就是不停的试,但好象结果经常不一样,
这里举XML为例, XML的头、XML文字的字符集和XML文件的字符集(就是另存为时可以看到的文件字符集)之间是什么关系?

下面是XML中有中文时的情况:
如果文件头是UTF-8,文件字符集ANSI,文件文字是UTF-8,这样XML就会无法解析,是一个不正确的XML格式;
如果文件头是GB2312,文件字符集是UTF-8,文件文字是UTF-8,里面的中文会乱码...

反正经常是不同的组合有不同的现象;

JAVA文件中,如果String s = "abc"; 那么这个abc是什么字符集? 跟操作系统字符集一样还是ISO8859-1?
有什么方法查询一个字符串的字符集吗?
...全文
102 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
随风醉舞 2008-09-11
  • 打赏
  • 举报
回复
我一般都是用utf-8!
herowach 2008-09-11
  • 打赏
  • 举报
回复
不会告诉我,大家都没遇到字符集的问题吧...
sleepzzzzz 2008-09-10
  • 打赏
  • 举报
回复
是吧
sleepzzzzz 2008-09-10
  • 打赏
  • 举报
回复
jackson416 2008-09-10
  • 打赏
  • 举报
回复
楼上真强。。。。。
老紫竹 2008-09-10
  • 打赏
  • 举报
回复
laorer 2008-09-10
  • 打赏
  • 举报
回复
不知道,我想是 utf8,
herowach 2008-09-10
  • 打赏
  • 举报
回复
顶,大家遇到字符集问题一般的解决流程是什么样的啊?

例如先尝试给字符穿转码,还有传输方式等```
herowach 2008-09-10
  • 打赏
  • 举报
回复
我晕,检查字符集这么多代码的....,
有谁能说下那三个地方字符集之间的关系吗?

一般遇到其中某一项或两项字符集不一样,应该怎么解决呢?

很多有试过了象 new String(str.getBytes("GBK"),"UTF-8");等,但还是不见好...

81,094

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧