社区
Web 开发
帖子详情
Jsoup 爬不了 iframe 中的内容
Eniak
2013-06-17 01:44:41
我正在试图分析一个网页,网页里面,内嵌了一个 iframe。
iframe 里面有 body, 那个 body 里面有想要的内容。
可是每次只能获得 iframe 这个节点,但是节点里面的内容就获得不了了。
...全文
862
6
打赏
收藏
Jsoup 爬不了 iframe 中的内容
我正在试图分析一个网页,网页里面,内嵌了一个 iframe。 iframe 里面有 body, 那个 body 里面有想要的内容。 可是每次只能获得 iframe 这个节点,但是节点里面的内容就获得不了了。
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
qwlhw
2015-04-16
打赏
举报
回复
我也遇见了这个问题!楼主解决了吗,求分享
奈米奈米
2014-12-22
打赏
举报
回复
我也遇见了这个问题!你解决了吗
Baymax-P
2014-12-18
打赏
举报
回复
在浏览器显示的是这样的
爬出来的是这样的
iframe里面的内容爬不出来了
Eniak
2013-06-19
打赏
举报
回复
自己的东东,自己顶
翟翟2013
2013-06-19
打赏
举报
回复
简单的写了下,运行下试试,这样是可以获取的,不知道符合不? @Test public void aa() { String html = "<html><head><title>First parse</title></head>" + "<body><iframe><html><body>Parsed HTML into a doc.</body></html></iframe></body></html>"; Document doc = Jsoup.parse(html); String body = doc.select("iframe").first().text();// 得到ifrmae下的html字符串 Document ifmDoc = Jsoup.parseBodyFragment(body); // 将html字符串转成Document对象 // System.out.println(ifmDoc); String ibody = ifmDoc.select("body").text(); System.out.println(ibody); }
Eniak
2013-06-18
打赏
举报
回复
自己的东东,自己顶
自动抓取网页
中
的flash
自动抓取网页
中
的flash,谢谢使用。软件为网上所有,如使用本软件从事不道德的事情,请自行负责。
提取网页的word,excel,PPT,等等各种网页数据方法大全
提取网页的word,excel,PPT,等等各种网页数据方法大全
去嵌入
去嵌入
scallot:Scala HTTP Bot 解析网页
中
的嵌入视频
扇贝 Scala HTTP Bot 解析网页
中
的嵌入视频
Jsoup
+selenium
爬
取
iframe
内容
的方法
1.引入相关依赖 <dependency> <groupId>io.github.bonigarcia</groupId> <artifactId>webdrivermanager</artifactId> <version>5.0.3</version> </dependency> <dependency> <groupId>org.seleniumhq.s
Web 开发
81,122
社区成员
341,744
社区内容
发帖
与我相关
我的任务
Web 开发
Java Web 开发
复制链接
扫一扫
分享
社区描述
Java Web 开发
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章