Windows下, 如何判别文件的编码?

snowmansh 2005-12-09 01:36:50
在windows下,当打开一个文件是,如需要判别

其编码(ANSI、UTF-16LE、UTF-16BE、UTF-8),

应该如何进行呢?

我知道有个IsTextUnicode的函数,但尝试N次后,

发现它根本无法辨别UTF-8和UTF16-BE,MSDN

library里面,对这个函数的描述,也没有提到

UTF-8,所以我想应该是不支持对UTF8的辨别。

不知道有没有其他的Windows API,或第三方库,

能够对文件的编码进行识别???

请指教。
...全文
156 6 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
snowmansh 2005-12-10
  • 打赏
  • 举报
回复
我其实是求一个大概的算法,或者相关的文档。

然后作个库(或函数),用于判别文件的编码。

举个例子吧,就象Notepad一样,当打开文件时,可以判别

文件的编码。我尝试擦掉文件的Byte Order mark,Notepad

照样可以判别编码,而且准确率很高。Byte Order Mark是不可靠的,

Notepad显然用了概率来判别。

哪位知道?
vcmute 2005-12-09
  • 打赏
  • 举报
回复
Byte-order mark Description
EF BB BF UTF-8
FE FF UTF-16/UCS-2, little endian
FF FE UTF-16/UCS-2, big endian
FF FE 00 00 UTF-32/UCS-4, little endian.
00 00 FE FF UTF-32/UCS-4, big-endian.
rivershan 2005-12-09
  • 打赏
  • 举报
回复
用UltraEdit打开看头几个字节
然后codeproject上有关于编码的代码
菜牛 2005-12-09
  • 打赏
  • 举报
回复
只有自己根据编码的规则来判断。
huangjianmin 2005-12-09
  • 打赏
  • 举报
回复
我是不知道,可知道这问题的人多了.干嘛用激法一样.
snowmansh 2005-12-09
  • 打赏
  • 举报
回复
没有人知道吗?

16,548

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC相关问题讨论
社区管理员
  • 基础类社区
  • AIGC Browser
  • encoderlee
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

        VC/MFC社区版块或许是CSDN最“古老”的版块了,记忆之中,与CSDN的年龄几乎差不多。随着时间的推移,MFC技术渐渐的偏离了开发主流,若干年之后的今天,当我们面对着微软的这个经典之笔,内心充满着敬意,那些曾经的记忆,可以说代表着二十年前曾经的辉煌……
        向经典致敬,或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天,我们期待着MFC技术能够恢复其曾经的辉煌,或许这个期待会永远成为一种“梦想”,或许一切皆有可能……
        我们希望这个版块可以很好的适配Web时代,期待更好的互联网技术能够使得MFC技术框架得以重现活力,……

试试用AI创作助手写篇文章吧