httpUrlConnection 提取html 流 出现乱码!!!

heng123 2008-11-20 03:14:51
从网站中抽取的html,编码的格式是iso-8859-1,是英文的网站,得到的html,有一些乱码,出现一些类似“ “”” ,我的工作平台式win,这是编码问题。
URL link = new URL(url);
HttpURLConnection connection = (HttpURLConnection) link.openConnection();
connection.connect();
stream = connection.getInputStream();
reader2 = new BufferedReader(new InputStreamReader(stream, "ISO-8859-1"));

while ((sCurrentLine = reader2.readLine()) != null) {

htmls.append(sCurrentLine);
System.out.println(sCurrentLine);
}

htmls中会出现乱码。网站是英文的,编码是默认。
请问高手如何解决???
我也试过“uft-8”都一样

...全文
599 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
wc619838119 2008-11-20
  • 打赏
  • 举报
回复
走走,我无能为力
wj_18 2008-11-20
  • 打赏
  • 举报
回复
bacel5902 2008-11-20
  • 打赏
  • 举报
回复
ISO-8859-1变成ISO8859-1,有时这个也会成为问题所在~
  • 打赏
  • 举报
回复
实在不行使用apache的htmlClient得了。。
heng123 2008-11-20
  • 打赏
  • 举报
回复
出现乱码的都是英文的 标点符号。麻烦大家帮帮忙!!谢谢

81,092

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧