Jsoup 爬不了 iframe 中的内容

Eniak 2013-06-17 01:44:41
我正在试图分析一个网页,网页里面,内嵌了一个 iframe。

iframe 里面有 body, 那个 body 里面有想要的内容。

可是每次只能获得 iframe 这个节点,但是节点里面的内容就获得不了了。

...全文
833 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
qwlhw 2015-04-16
  • 打赏
  • 举报
回复
我也遇见了这个问题!楼主解决了吗,求分享
奈米奈米 2014-12-22
  • 打赏
  • 举报
回复
我也遇见了这个问题!你解决了吗
Baymax-P 2014-12-18
  • 打赏
  • 举报
回复
在浏览器显示的是这样的
爬出来的是这样的
iframe里面的内容爬不出来了
Eniak 2013-06-19
  • 打赏
  • 举报
回复
自己的东东,自己顶
翟翟2013 2013-06-19
  • 打赏
  • 举报
回复
简单的写了下,运行下试试,这样是可以获取的,不知道符合不? @Test public void aa() { String html = "<html><head><title>First parse</title></head>" + "<body><iframe><html><body>Parsed HTML into a doc.</body></html></iframe></body></html>"; Document doc = Jsoup.parse(html); String body = doc.select("iframe").first().text();// 得到ifrmae下的html字符串 Document ifmDoc = Jsoup.parseBodyFragment(body); // 将html字符串转成Document对象 // System.out.println(ifmDoc); String ibody = ifmDoc.select("body").text(); System.out.println(ibody); }
Eniak 2013-06-18
  • 打赏
  • 举报
回复
自己的东东,自己顶

81,095

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧