推荐一个编码检测的工具类,链接如下:
http://blog.csdn.net/arthersophy/archive/2011/04/08/6309216.aspx
头文件主要方法:
int detect_encoding(unsigned char* rawtext);
覆盖的文件编码类型:
enum Encodings { GB2312, GBK, GB18030, HZ,
BIG5, BIG5PLUS, EUC_TW, ISO_2022_CN,
EUC_KR, CP949, ISO_2022_KR, JOHAB,
EUC_JP, SJIS, ISO_2022_JP,
UTF8, UTF16,
ASCII, OTHER, TOTAL_ENCODINGS }; // 基本上覆盖到了所有的编码格式
回复着,皆有分!!!