如何用JAVA 判断一个文本文件的编码字符集?高分请教各位大侠!!!

wacj940710057 2012-06-11 11:13:43
比如 从 greepplum 数据库导出来的纯数据的文本文件,我想知道它是以什么字符集编码的!数据量很大,不能用本文编辑工具打开!!!我该怎么办?
...全文
4225 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
wacj940710057 2012-06-12
  • 打赏
  • 举报
回复
谢谢各位,给分结贴了
nmyangym 2012-06-12
  • 打赏
  • 举报
回复
utf-8前面3个字节标志:ef bb bf
五哥 2012-06-11
  • 打赏
  • 举报
回复
"ANSI|ASCII" 是5C75
五哥 2012-06-11
  • 打赏
  • 举报
回复
//其中的 0xefbb、0xfffe、0xfeff、0x5c75这些都是这个文件的前面两个(忘了网上或者自己另存一下看看是什么)字节的16进制数
curbstone119 2012-06-11
  • 打赏
  • 举报
回复
1:可以试试
Unicode:       前两个字节为FFFE;
Unicode big endian: 前两字节为FEFF; 
UTF-8:        前两字节为EFBB; 
其他的格式没找到,不过如果是中文的话,除了UTF8就是GB2312,要不就是BIG5,
2.取前100个字符,用格式编码尝试,看哪个不是乱码

3.用其他文本编辑工具打开
Jota Text Editor
Jota 是一个为超长文本文件设计的文本编辑器。
她的名字发音为 "i-o-ta"。
特性
- 支持多达 100 万个字符。
- 自动检测多种字符编码。
五哥 2012-06-11
  • 打赏
  • 举报
回复
	/**
* 判断文件的编码格式
* @param fileName :file
* @return 文件编码格式
* @throws Exception
*/
public static String codeString(String fileName) throws Exception{
BufferedInputStream bin = new BufferedInputStream(
new FileInputStream(fileName));
int p = (bin.read() << 8) + bin.read();
String code = null;
//其中的 0xefbb、0xfffe、0xfeff、0x5c75这些都是这个文件的前面两个字节的16进制数
switch (p) {
case 0xefbb:
code = "UTF-8";
break;
case 0xfffe:
code = "Unicode";
break;
case 0xfeff:
code = "UTF-16BE";
break;
case 0x5c75:
code = "ANSI|ASCII" ;
break ;
default:
code = "GBK";
}

return code;
}
brightyq 2012-06-11
  • 打赏
  • 举报
回复
获取文件的前三个字节。
五哥 2012-06-11
  • 打赏
  • 举报
回复

/**
* 判断文件的编码格式
* @param fileName :file
* @return 文件编码格式
* @throws Exception
*/
public static String codeString(String fileName) throws Exception{
BufferedInputStream bin = new BufferedInputStream(
new FileInputStream(fileName));
int p = (bin.read() << 8) + bin.read();
String code = null;

switch (p) {
case 0xefbb:
code = "UTF-8";
break;
case 0xfffe:
code = "Unicode";
break;
case 0xfeff:
code = "UTF-16BE";
break;
default:
code = "GBK";
}

return code;
}
dxqrr 2012-06-11
  • 打赏
  • 举报
回复
学习了,可行

62,614

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧