用java获取网页html,求助

tomatobin 2012-06-11 09:36:18
URL url = new URL("http://bbs.ustc.edu.cn/main.html");
InputStreamReader isr = new InputStreamReader(url.openStream(),"GB2312");
BufferedReader br = new BufferedReader(isr);
String strRead = "";
StringBuilder sb = new StringBuilder();
while ((strRead = br.readLine()) != null) {

sb.append(strRead+'\n');
}
br.close();
String res = sb.toString();

最后得到的res看不到网页的内容,提示dtd。。。
求助~~
...全文
194 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复
读取某个网页一般用ajax或者http协议之类
Looking_Glass 2012-06-12
  • 打赏
  • 举报
回复
个人认为:应该用字节流读取。
粗略写了一下,如:
        URL url = new URL("http://bbs.ustc.edu.cn/main.html");
InputStream input = url.openStream();
ByteArrayOutputStream output = new ByteArrayOutputStream();
int len = -1;
byte[] b = new byte[1024];
while( (len = input.read(b)) != -1){
output.write(b, 0, len);
}
String body = output.toString();
System.out.println(body);
tomatobin 2012-06-12
  • 打赏
  • 举报
回复
这个问题已经知道了,谢谢

50,530

社区成员

发帖
与我相关
我的任务
社区描述
Java相关技术讨论
javaspring bootspring cloud 技术论坛(原bbs)
社区管理员
  • Java相关社区
  • 小虚竹
  • 谙忆
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧