在servlet中通过一个url地址得到网页的内容,并且保存为一个html,能实现吗?

zhaoxichao 2004-03-24 09:18:46
比如用Spider、Bot、Aggregator的实现技术,能实现吗?
或者有别的好办法
...全文
152 14 打赏 收藏 转发到动态 举报
写回复
用AI写文章
14 条回复
切换为时间正序
请发表友善的回复…
发表回复
vision2000 2004-03-24
  • 打赏
  • 举报
回复
同意用文件流的方法实现。
我处理数据库中的二进制对象实现过。
你敢扫一扫吗 2004-03-24
  • 打赏
  • 举报
回复
import java.net.*;
import java.io.*;
public class URLConnectionReader
{
public static void main(String[] args) throws Exception
{
URL yahoo = new URL("http://www.chinaren.com/");
URLConnection yc = yahoo.openConnection();
BufferedReader in = new BufferedReader(
new InputStreamReader(
yc.getInputStream()));
String inputLine;
while ((inputLine = in.readLine()) != null)
System.out.println(inputLine);
in.close();
}
}
这样可以得到你想要的HTML代码,然后把这些代码写到一个HTML文件不就完了吗
zhaoxichao 2004-03-24
  • 打赏
  • 举报
回复
这是一个办法,可惜麻烦点
52juanjuan 2004-03-24
  • 打赏
  • 举报
回复
up up 学习高手
myxd 2004-03-24
  • 打赏
  • 举报
回复
zhaoxichao(小西)
HTM中的图片可以取得。但有前提就是你的把<IMG SRC..后面的图片的相对URL取出来(通过正则表达式),然后在通过HttpURLConnection来去图片。
xunyiren 2004-03-24
  • 打赏
  • 举报
回复
up
myxd 2004-03-24
  • 打赏
  • 举报
回复
URL url=new URL("http://192.168.0.109:8080/yinxing/content/12");
HttpURLConnection open=(HttpURLConnection)url.openConnection();
open.connect();
BufferedReader buf=new BufferedReader(new InputStreamReader(open.getInputStream()));
String temp=null;
while((temp=buf.readLine())!=null)System.out.println(temp);
buf.close();
zhaoxichao 2004-03-24
  • 打赏
  • 举报
回复
类似于保存成一个mht的web档案文件
zhaoxichao 2004-03-24
  • 打赏
  • 举报
回复
网页中的图片可以拿到吗?
Fortune2k1 2004-03-24
  • 打赏
  • 举报
回复
import java.io.*;
import java.net.*;
import java.util.Date;

class URLDemo
{
public static void main(String args[]) throws Exception
{
System.out.println("starting....");
int c;
URL url = new URL("http://www.sina.com.cn");
URLConnection urlcon = url.openConnection();
System.out.println("the date is : " + new Date(urlcon.getDate()));
System.out.println("content_type:" + urlcon.getContentType());
InputStream in = rulcon.getInputStream();
while(((c=in.read())!=-1))
{
System.out.println((char)c);
}
in.close();
}
}
myxd 2004-03-24
  • 打赏
  • 举报
回复
不清楚楼主要干什么?
是要把url指向的网页的内容保存下来?
如果事的话。用HttpURLConnection不就可以了吗?
donghx1234 2004-03-24
  • 打赏
  • 举报
回复
学习
zhang21cnboy 2004-03-24
  • 打赏
  • 举报
回复
没问题,可以把html当作一个文件打开,使用流传输,

我做过这东西。不过我的代码已经不再了
zcjl 2004-03-24
  • 打赏
  • 举报
回复
占楼听课

81,092

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧