求一个可以读取pdf表格里面内容的方式

a916026036 2015-03-21 03:01:52
本人用的apache.pdfbox的工具去读取pdf文件里面的内容,但是表格里面的内容怎么单独读出来,
如图所示


我这样做但是 取出来都链接在一起了不好区分,都是以文本的方式取出来的,不好分出某个单元格里面的内容
in = new FileInputStream(fileName);
PDFParser p = new PDFParser(in);
p.parse();
PDFTextStripper ts = new PDFTextStripper();
PDDocument document = p.getPDDocument();
System.out.println(ts.getText(document));

有什么办法可以读出表格里面的内容吗?table里面的,我用的方法是读Text

还有其他的方式吗?例如用Itext那个能取出来吗?
...全文
652 6 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
qq_39302224 2017-11-18
  • 打赏
  • 举报
回复
楼主 解决了吗 我也遇到这个问题了 至今不知怎么解决 求告知 qq:790181244
黑色卷纸 2016-05-30
  • 打赏
  • 举报
回复
请问楼主是怎么解决的?
小洋哥哥 2015-09-01
  • 打赏
  • 举报
回复
请问楼主是怎么解决的?
happyxiaoxxabc 2015-08-04
  • 打赏
  • 举报
回复
楼主你解决这个问了吗?
a916026036 2015-03-24
  • 打赏
  • 举报
回复
引用 1 楼 yanyueqiu 的回复:
你的意思是读出来,并对应放在某个表格内?
我的意思把pdf表格里面的内容读出来 存到数据库里面
言月秋 2015-03-23
  • 打赏
  • 举报
回复
你的意思是读出来,并对应放在某个表格内?

81,117

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧