编码转化问题

chenguokui 2007-10-08 04:26:20
package bs;

import java.net.*;
import java.io.*;

public class GetHtml {
public String gethtml(String addr) {

try {
URL url = new URL(addr);
BufferedReader br = new BufferedReader(new InputStreamReader(url
.openStream()));
String html = "";
StringBuffer sb = new StringBuffer("");
while ((html = br.readLine()) != null) {
sb.append(html + "\r\n");
}
br.close();

return sb.toString();
} catch (Exception e) {
return addr + "is error url";

}

}

public static void main(String[] args) {
GetHtml gh = new GetHtml();
String get_html = gh.gethtml("http://www.baidu.com");
try {
System.out.println(new String(get_html.getBytes("gb2312")));

} catch (Exception e) {
System.out.println(e.toString());
}

}
}

我的工作平台是linux,baidu的编码是gb2312,我用getbytes进行转化,但是还是乱码,为什么

...全文
70 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
dddeee 2007-11-15
  • 打赏
  • 举报
回复
你还要看自己的linux是什么编码,如果是utf-8,在new String(get_html.getBytes( "gb2312 "))的时候还要加上utf-8这个参数

62,623

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧