高分求助!关于utf-8的问题

dengwei007 2004-03-12 01:21:03
高分求助!关于utf-8的问题

繁体的“中”,对应的ascii码为45,78(00101101 01001110),用chrb(45)+chrb(78)就可以显示出来。

在测试的网页http://buffy.lib.unimelb.edu.au/collections/asian/chi-ejournals.html中,有“中國期刊網提錄數據庫Tsinghua”,这几个字,编码用繁体Big5可以正常显示,可以通过工具查到“中”其utf-8的编码为,228,184,173
即:11100100 10111000 10101101
1110xxxx 10xxxxxx 10xxxxxx
有:001001110 00101101
重排:00101101 001001110。
这个是没有问题的。

但是我一旦选择编码为utf-8时,测试的网页显示不正常,变成了“¤¤°괁¥Zºڮw”这样的符号,
“中”字其utf-8码变为194,164,再经过换算就变成了asc码为164的字符!

请问有谁能明白其中的原理???

我问这个问题是因为我现在有一个程序获得的数据是经过utf错误转换后的结果,例如上面的194,164,请问该如何恢复为原来的正常数据(45,78或者228,184,173)呢?

谢了!
...全文
94 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
supergreenbean 2004-03-17
  • 打赏
  • 举报
回复
那个网页源文件里的“中”确实是繁体,但你更换IE编码后复制的“中”就不是了。所以还是建议你先进行简繁转换,如果你要在简体系统里显示页面的话
dengwei007 2004-03-17
  • 打赏
  • 举报
回复
至于数据是copy到剪贴板里,再分析剪贴板中的数据得出来的,也许IE会有个转换吧。
dengwei007 2004-03-17
  • 打赏
  • 举报
回复
这个问题和简体繁体没有关系吧?
那个网页是繁体的,我就以为那个中是繁体了。
rainstormmaster 2004-03-15
  • 打赏
  • 举报
回复
//45,78出来的是简体的“中”

是的,是简体的“中”,所以希望楼主能够整理一下后,给出新的数据
supergreenbean 2004-03-15
  • 打赏
  • 举报
回复
45,78出来的是简体的“中”
dengwei007 2004-03-15
  • 打赏
  • 举报
回复
你可以试一下在word里面用宏,
输出chrb(45) & chrb(78)
或者chrb(78) & chrb(45)
千真万确是“中”
这个我可以肯定的。

7,763

社区成员

发帖
与我相关
我的任务
社区描述
VB 基础类
社区管理员
  • VB基础类社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧