社区
Java SE
帖子详情
Jsoup成对抓取标签内容
phoenix_sxy
2018-01-13 10:09:27
各位大神们,我现在想抓取网页成对的标签。
举个栗子,像上图一样,会有多首诗歌,但是诗歌内容和标题是两个不同类型的标签。我现在用document.select()只能一次取出所有标题,一次取出所有诗歌,但是两者不对应。想对应取出标题和诗歌内容!
麻烦各位大大路过帮帮忙~
...全文
530
1
打赏
收藏
Jsoup成对抓取标签内容
各位大神们,我现在想抓取网页成对的标签。 举个栗子,像上图一样,会有多首诗歌,但是诗歌内容和标题是两个不同类型的标签。我现在用document.select()只能一次取出所有标题,一次取出所有诗歌,但是两者不对应。想对应取出标题和诗歌内容! 麻烦各位大大路过帮帮忙~
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
phoenix_sxy
2018-01-13
打赏
举报
回复
刚刚自己试出来了,但还是感谢各位还没看到的大大们。用的document.seclect("div.content").first().remove.保证了每首诗的标题和内容是对应的了。
JAR包—
jsoup
HTML
抓取
JAR包—
jsoup
HTML
抓取
:可以去掉html
标签
或者提取部分
内容
jsoup
多线程爬虫
这是一个多线程用
jsoup
抓取
网站新闻
内容
的demo,详细的代码示例,使用这个工具类主要知道如何从
抓取
的html文档里根据
标签
取
内容
就OK了。简单粗暴。
Java爬虫从入门到精通
本课程是java大数据系列课程的数据采集部分,通过java爬虫技术从互联网进行在线数据采集,存储。对于本课程学习要求具有一定的java编程基础。通过本课的学习,能够掌握爬虫技术原理,数据采集的原则,数据采集的方式,
Jsoup
页面分析技术,Httpclient工具的使用等爬虫项目实战。
Android_
Jsoup
网页爬虫案例
给出网址可以
抓取
网页上的代码 可自己根据
抓取
网页的源码来修改要追踪的
标签
。 此demo为了熟悉和使用
jsoup
。
Jsoup
+httpclient 模拟登陆和
抓取
//对link
标签
有href的路径都作处理 for (Element link : links) { String hrefAttr = link.attr("href"); if (hrefAttr.contains("/personal.css")) { hrefAttr = hrefAttr.replace("/personal....
Java SE
62,614
社区成员
307,307
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章