pdfbox 读取PDF使用求助

liuyang19890710 2017-07-27 10:48:54
现在可以用pdfbox抽取到pdf文件的内容,但是页眉的内容也夹杂在正文中间,想把页眉去掉。
itext读取的正文内容行间没有换行,直接连在一起。
itext可以读到无页眉的正文内容,但行与行的顺序不对,不是正确顺序,而是按照它在pdf文件中的位置,举个例子:一页分为两个页面,读完左边子页的第一行,正确的顺序是读左边子页的第二行,结果却读成了右边子页的第一行。
请问懂pdf文件操作的前辈指点一下,感激不尽啊!!!
...全文
91 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

50,530

社区成员

发帖
与我相关
我的任务
社区描述
Java相关技术讨论
javaspring bootspring cloud 技术论坛(原bbs)
社区管理员
  • Java相关社区
  • 小虚竹
  • 谙忆
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧