社区
Java
帖子详情
pdfbox 读取PDF使用求助
liuyang19890710
2017-07-27 10:48:54
现在可以用pdfbox抽取到pdf文件的内容,但是页眉的内容也夹杂在正文中间,想把页眉去掉。
itext读取的正文内容行间没有换行,直接连在一起。
itext可以读到无页眉的正文内容,但行与行的顺序不对,不是正确顺序,而是按照它在pdf文件中的位置,举个例子:一页分为两个页面,读完左边子页的第一行,正确的顺序是读左边子页的第二行,结果却读成了右边子页的第一行。
请问懂pdf文件操作的前辈指点一下,感激不尽啊!!!
...全文
91
回复
打赏
收藏
pdfbox 读取PDF使用求助
现在可以用pdfbox抽取到pdf文件的内容,但是页眉的内容也夹杂在正文中间,想把页眉去掉。 itext读取的正文内容行间没有换行,直接连在一起。 itext可以读到无页眉的正文内容,但行与行的顺序不对,不是正确顺序,而是按照它在pdf文件中的位置,举个例子:一页分为两个页面,读完左边子页的第一行,正确的顺序是读左边子页的第二行,结果却读成了右边子页的第一行。 请问懂pdf文件操作的前辈指点一下,感激不尽啊!!!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
C#
使用
PDF
Box
读取
PDF
C#中
使用
PDF
Box
读取
PDF
的内容,转换成TXT文件保存。
Java 解析
PDF
,
pdf
box
读取
PDF
内容
NULL 博文链接:https://snowdymy.iteye.com/blog/1114344
pdf
box
提取
pdf
文件中的图片
PDF
Box
是一个开源的可以操作
PDF
文档的Java
PDF
类库。它可以创建一个新
PDF
文档,操作现有
PDF
文档并提取文档中的内容。 它具有以下特性: 1.将一个
PDF
文档转换输出为一个文本文件。 2.可以从文本文件创建一个
PDF
文档。 ...
pdf
box
读取
pdf
文档转为高清图片的例子
使用
pdf
box
读取
pdf
文件的内容并转为高清图片存储至硬盘
pdf
box
api,
pdf
box
-tools
pdf
box
提取
pdf
中 文字和图片 并 可转 html
pdf
box
提取
pdf
中 文字和图片 并 可转 html 分2个文件,一个专门提取文本,内容可转为html,另一个文件专门用来提取图片,大家可自行整合为一个文件。
使用
pdf
box
最新提取图片的方法。
Java
50,530
社区成员
85,610
社区内容
发帖
与我相关
我的任务
Java
Java相关技术讨论
复制链接
扫一扫
分享
社区描述
Java相关技术讨论
java
spring boot
spring cloud
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章