爬虫爬取pdf格式内容

struts2_hibernate_sp 2014-01-13 09:26:32
诸位大神,求指点。。。。
在爬取网页数据的时候,发现里面有学正文内容是在pdf中的,请问大神们怎样爬取下来这些内容啊,我的程序用的是jsoup。。。谢谢
...全文
598 1 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
打字员 2014-01-13
  • 打赏
  • 举报
回复
你可以把pdf下載下來,然后用軟件把pdf內的文字讀取出來... 這真是一個坑爸爸的方法!

81,122

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧