如何从出版社给的排版文件中抓取数据

wangchaojing 2017-08-14 04:23:31


有没有大神做过出版社方面的项目的,出版社的数据如何抓取呀

出版社给了一些数据,如何抓取到这里面的数据。只要能从一个文件中读取到就可以。 有没有一些好的抓取方法推荐呀



还有pdf的文件,从pdf中抓取数据有什么好的办法没?
...全文
250 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
wangchaojing 2017-08-16
  • 打赏
  • 举报
回复
wangchaojing 2017-08-14
  • 打赏
  • 举报
回复
引用 1 楼 qq_16259463 的回复:
这么多格式的文件,你看看如何解析吧,或者你看看itext这个包,是用来解析pdf的
好的,其实这些不同格式文件的内容都是一样的,只要能解析一种就可以的
疯雪 2017-08-14
  • 打赏
  • 举报
回复
这么多格式的文件,你看看如何解析吧,或者你看看itext这个包,是用来解析pdf的

33,008

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧