社区
Java SE
帖子详情
如何UTF-8转换为GB-2312?
freebyte
2004-03-29 01:03:33
我要读取一个UTF-8的文件:new StreamSource(new FileInputStream(inFilename))
读取后,我能把它转换为GB-2312编码吗?或其他显示中文的编码
...全文
108
15
打赏
收藏
如何UTF-8转换为GB-2312?
我要读取一个UTF-8的文件:new StreamSource(new FileInputStream(inFilename)) 读取后,我能把它转换为GB-2312编码吗?或其他显示中文的编码
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
15 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
freebyte
2004-04-07
打赏
举报
回复
to yyfhz(火山):
输入是XML文件
freebyte
2004-04-07
打赏
举报
回复
就是XML文件啊?
yyfhz
2004-04-06
打赏
举报
回复
to freebyte(礁)
你的输入文件该不是XML吧
allenhe
2004-04-06
打赏
举报
回复
Charset
CharsetEncoder
CharsetDecoder
在java.nio包里面
enjoy~~
freebyte
2004-04-06
打赏
举报
回复
以下是我的解决方案,中文能识别了,可是这样的转换,把“ < ” 解释为 &alt了, 我该怎么解决这个问题啊?
Source source = new StreamSource(new FileInputStream(inFilename),"GBK");
FileOutputStream fout=null;
Writer out =null;
try {
fout=new FileOutputStream(outFilename);
out= new OutputStreamWriter(fout, "GBK");
} catch (UnsupportedEncodingException e1) {
// TODO 自动生成 catch 块
e1.printStackTrace();
}
yyfhz
2004-03-29
打赏
举报
回复
用fileReader--encoding =utf-8 将以文件的内容以utf-8的格式读出来,将其内容放在String str中,
注意噢,java 中总是以unicode的编码方式来设置String的,所以就不用管str本身的编码方式拉. 那么现在str保存的就是file中的内容了。
下面用GB2312的编码方式对 str中的内容进行解码
byte b[]= str.getBytes("GB2312").
OK!
freebyte
2004-03-29
打赏
举报
回复
to: tigeryu(吴越小虎)
我用了weblucene的CJKanalyzer,可是还是不能查询中文?
why?
你知道有哪些好用吗?该怎么用啊?
发到我信箱,ok? bytefree@163.com
wwlzlk
2004-03-29
打赏
举报
回复
str = new String(str.getBytes("UTF-8"),"GB2312");
freebyte
2004-03-29
打赏
举报
回复
to:tigeryu(吴越小虎)
lucene的1.3,standardAnalyzer不是就已经支持中文了吗?查询中文,能显示啊?
这是为什么啊?
wuyue-tiger
2004-03-29
打赏
举报
回复
要用lucene检索中文,关键不在于此,作为一个数据流本身是没有什么编码的概念的,主要是这个数据流输入的原始数据是通过何种编码方式转成数据流的,你必需再用这种编码方式将它转回成原始数据。
你要让lucene支持中文,最主要的是要有一个中文的词法分析器(Analyzer),这样就可以了
caiyanying732
2004-03-29
打赏
举报
回复
帮你顶
freebyte
2004-03-29
打赏
举报
回复
to tx18(华哥) :
你这是转换string 字符串的格式吧,我这是要将流的编码改变。
我用了:try {
reader = new BufferedReader(new InputStreamReader(is, "GBK"));
String d=new InputStreamReader(is, "GBK").getEncoding();
doc.add(Field.Text("contents", reader));
} catch (UnsupportedEncodingException e) {
// TODO 自动生成 catch 块
e.printStackTrace();
System.out.println("格式转换不对");
}
可用起来,还是不能检索(luncene)中文。
boy
2004-03-29
打赏
举报
回复
str = new String(str.getBytes("UTF-8"),"GB2312");
boy
2004-03-29
打赏
举报
回复
tr = new String(str.getBytes("UTF-8"),"GB2312");
freebyte
2004-03-29
打赏
举报
回复
有没有设置流的编码格式的东东啊
批量文件编码
转换
工具(
Utf-8
转
GB
2312
、
GB
2312
转
Utf-8
)
本工具可以根据需要批量将一个目录及其子目录下的所有文件
转换
为
GB
2312
或
Utf-8
编码文件,绿色软件,无需安装。 需要.NET Framework v2.0 运行库支持。
完美
转换
UTF-8
到
GB
2312
(源代码和详细说明)
不幸的是,广收欢迎的代码查看工具Source insight 虽然支持汉字,但是它不支持
UTF-8
。笔者感到疑惑的是,当初开发source insight的这帮人现在哪里去了?为何不继续开发?这么好的工具,却不再更新了,实在让人可惜。...
9节课征服「字符编码」
ASCII、
GB
2312
、
GB
K、
GB
18030Unicode、
UTF-8
、UTF-16、UTF-32
文本文件编码
转换
工具
gb
k utf8
gb
2312
charset=
utf-8
"></HEAD> "说明此文件编码为utf8" 4)在 mysql_select_db("表名",$id); 后面加入一行 mysql_query("set names utf8;"); <!-----说明数据库连接也用utf8编码-----> 5)*.php 文件在存盘的时候也以 ...
utf-8
转换
为
gb
2312
后网页乱码的解决方法
utf-8
转换
为
gb
2312
后网页乱码的解决方法:用记事本打开源码,另存为,编码 那里选择 ANSI 即可 一、如果想把
utf-8
转为
GB
2312
用记事本打开源码,另存为,编码 那里选择 ANSI 即可。 二、如果想把
GB
2312
转为
utf-8
...
Java SE
62,614
社区成员
307,327
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章