Java如何修改PDF

NULL_8757512 2008-07-22 11:17:13
公司上面有些要求,是吧一份pdf文档转成xml格式的。 不过其中标签都是自定的,所以需要自己修改。

我想要做的是给pdf文档中的标题行前面和后面都加上一些标签

比如pdf文档如下:

我是标题
我是内容我是内容我是内容我是内容我是内容,
我是内容我是内容我是内容我是内容我是内容,
我是内容我是内容我是内容我是内容我是内容。


于是我想读取pdf文件,然后生成的xml文档格式如下:

<somecode>我是标题</soomcode>
我是内容我是内容我是内容我是内容我是内容,
我是内容我是内容我是内容我是内容我是内容,
我是内容我是内容我是内容我是内容我是内容。


我现在用过 PDFClown , PDFBox

查阅了一下API,发现都是有转成txt格式的功能,可是一旦转成txt格式 就不存在什么标题不标题了。

我查阅了一下关于Bookmark方面的api,发现只能获取、添加、删除、修改 Bookmark

好像没有从Bookmark获得 该Bookmark所在第几行方面的功能。

因为我英语不是很好,所以API也不是特看的明白。

要是谁有什么方法弄,或者知道相关API的 麻烦告诉我一下 谢谢了。

ps: 我的pdf文件里面已经建立好书签了,书签所对的位置就是文档的标题。

希望能帮帮我,哪怕帮我顶一下呢 因为挺着急用的 谢谢了。
...全文
192 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
EasyPDF 2008-07-23
  • 打赏
  • 举报
回复
抽取标题本身就是很麻烦的事情,即使你自己加了一些标记,那也需要在读取的时候特殊处理一下,必须自己做

可以加我qq详谈329969959
NULL_8757512 2008-07-22
  • 打赏
  • 举报
回复
up一下 没人回答 结贴了。

62,615

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧