Java如何获取动态网页最终的HTML代码?

doc_peter 2014-09-30 07:51:35
如题,目前自己可以用Java获取静态HTML代码,但有一部分文字在网页页面上可以看到,却不能在HTML代码中看到,如何用Java获取这样的HTML代码?

PS:换种说法,网页内容用chrome查看网页源代码看不到,查看审查元素可以看到,想获取这样的内容该怎么办?
...全文
423 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
Magical茏 2014-09-30
  • 打赏
  • 举报
回复
引用 1 楼 rumlee 的回复:
可以使用htmlunit做到,htmlunit可以模拟浏览器运行,并且有js引擎。 这个框架用于一般小型爬虫项目,需要执行js才能够得到网页内容的非常有用。
\不错!涨知识了
doc_peter 2014-09-30
  • 打赏
  • 举报
回复
引用 1 楼 rumlee 的回复:
可以使用htmlunit做到,htmlunit可以模拟浏览器运行,并且有js引擎。 这个框架用于一般小型爬虫项目,需要执行js才能够得到网页内容的非常有用。
多谢指导,我先学习一下如何使用,不懂的地方还要继续请教您!
rumlee 2014-09-30
  • 打赏
  • 举报
回复
可以使用htmlunit做到,htmlunit可以模拟浏览器运行,并且有js引擎。 这个框架用于一般小型爬虫项目,需要执行js才能够得到网页内容的非常有用。
疯癫行者 2014-09-30
  • 打赏
  • 举报
回复
引用 1 楼 rumlee 的回复:
可以使用htmlunit做到,htmlunit可以模拟浏览器运行,并且有js引擎。 这个框架用于一般小型爬虫项目,需要执行js才能够得到网页内容的非常有用。

62,614

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧