请教如何判断一个文本文件的编码方式(ANSI,UNICODE,UTF-8等)?

ragnarok 2004-06-20 06:43:58
我只知道 Unicode编码的文本文件,其文件头2个字节一定是"0xff","0xfe"的,但UTF-8呢?
怎么才能准确获得一个文本文件的编码方式?最好有代码,谢谢各位了!
...全文
685 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
rgwfeng2 2004-07-09
  • 打赏
  • 举报
回复
hottey 2004-06-21
  • 打赏
  • 举报
回复
学习..关注
耙子 2004-06-21
  • 打赏
  • 举报
回复
楼上说得对,由于CPU寻址方式的不同,导致2字节的unicode有存放方式,Big Endian和Small Endian,
他们对应的文本文件的头两个字节分别是0xFEFF和0xFFFE。

但是unicode字符串就没有这个标志了
aiirii 2004-06-21
  • 打赏
  • 举报
回复
http://blog.joycode.com/zjf/posts/24581.aspx

unicode文本文件:头两个字符分别是FF FE(16进制)
unicode big endian文本文件:头两个字符分别是FE FF(16进制,big endian自然会是相反的)

utf-8文本文件:头两个字符分别是EF BB(16进制)

可以用记事本打开一个文本文件,以各种方式另存为,再用16进制编辑器就可以看到了。
HarryZhang 2004-06-21
  • 打赏
  • 举报
回复
utf-8 encodehead
"oxff","oxfe","oxff","oxfe"
ragnarok 2004-06-21
  • 打赏
  • 举报
回复
自己顶一下

5,388

社区成员

发帖
与我相关
我的任务
社区描述
Delphi 开发及应用
社区管理员
  • VCL组件开发及应用社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧