如何使用爬虫技术(Jsoup)提取页面准确数据?

qq_37399847 2017-01-23 02:10:53

如上图;
想要获取:
项目名称 太康县马厂镇2014年通村公路建设工程项目
招标单位 太康县马厂镇人民政府
中标候选人名称 信阳市金江工程有限公司 1 河南恒亘路桥工程有限公司 2 商丘市恒信路桥工程有限公司
项目经理/项目总监/ 项目负责人 郑东东 许留哲 叶修林

获取之后保存到数据库

请大神帮忙给个方法



...全文
540 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
showhunter74 2017-02-04
  • 打赏
  • 举报
回复
你打印结果的时候,可以不用text(),用html()。这样获取的就是带Html标签的字符串。然后用jsoup.parse(string),就能把页面转成document元素了。然后你想怎么整都可以了。各种根据id获取,class获取,tab获取都行。
weare微儿 2017-02-04
  • 打赏
  • 举报
回复
可爱的小莱 2017-01-29
  • 打赏
  • 举报
回复
使用python,python擅长爬虫工作。
12312312312wwqeqw 2017-01-25
  • 打赏
  • 举报
回复

81,092

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧