社区
Java SE
帖子详情
怎样用java读取网页的内容?
li_new
2002-08-12 04:48:56
怎样用java读取网页的内容,因为我想将网页中的内容转换成pdf文档?
...全文
91
7
打赏
收藏
怎样用java读取网页的内容?
怎样用java读取网页的内容,因为我想将网页中的内容转换成pdf文档?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
7 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
chenzhp
2010-05-27
打赏
举报
回复
做一个标记。
anod
2002-08-13
打赏
举报
回复
如果想把得到的文件转成pdf文件,最简单的办法是找一个html2pdf的工具,然后用java方法带参数启动这个转换程序。另外,我不知道Adobe公司是否有pdf文档的专用java api库,如果有的话,用哪个导也可以。
anod
2002-08-13
打赏
举报
回复
我说一个方法:
1、得到网页的url(当然了,没有这个没法取网页);
2、用url创建一个InetAddress对象,并用它创建一个Socket对象;
3、从Socket对象得到InputStream和PrintStream;
4、按照http协议向PrintStream写数据(就是GET URL HTTP/1.0\R\N HOST:...,实际上是给服务器一个请求,就象ie访问一样);
5、从InputStream取得响应头,分析里面的http状态码,如果是2**的话,说明访问成功,同时监测Location头,看是否有转向。如果转向的话,按照上面的方法继续访问。
6、如果没有上述的意外情况,在响应头后面有一个空行,然后的内容就是html文件了。
7、好要注意比如连接超时、socket异常等情况,需要分别处理,比如重试或者终端连接等等。
zhangkai
2002-08-12
打赏
举报
回复
URLConnection可以搞定,不过好怎么转成pdf就不知道了
signboy
2002-08-12
打赏
举报
回复
关注!
SQLException
2002-08-12
打赏
举报
回复
貫注
telenths
2002-08-12
打赏
举报
回复
用 URLConnection
Java
读取
word文档
内容
并输出成
网页
(含图片,公式)
本代码实现使用
Java
程序
读取
word文档成
网页
,将word文档按原样在
网页
输出。项目编码为UTF-8,文件编码也是utf8,再不要说乱码这种骚话了,选择utf8加载项目就不会乱码
java
读取
远程
网页
乱码解决方案
java
读取
远程
网页
乱码解决方案
java
读取
远程
网页
乱码解决方案
Java
反射机制与框架原理
使用反射机制,
读取
类中的注解信息 * 以反射和注解为基础,演示数据库SQL的自动生成 * 注解的默认值,默认注解,元注解和内置注解 * 以全局实例管理为例,演示一般性的框架设计方法 三、课程体系 〖
Java
学习指南〗...
java
实现
读取
html
网页
文件
可以
读取
任何html
网页
的
内容
,适用于
读取
网页
内容
保存到数据库字段中
JAVA
读取
远程
网页
文件并保存本地
JAVA
读取
远程
网页
文件并保存本地 从远程URL地址获取
网页
文件下载到本地 这个方法可以生成静态HTML文件使用!
Java SE
62,614
社区成员
307,327
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章