本人用的apache.pdfbox的工具去读取pdf文件里面的内容,但是表格里面的内容怎么单独读出来,
如图所示
我这样做但是 取出来都链接在一起了不好区分,都是以文本的方式取出来的,不好分出某个单元格里面的内容
in = new FileInputStream(fileName);
PDFParser p = new PDFParser(in);
p.parse();
PDFTextStripper ts = new PDFTextStripper();
PDDocument document = p.getPDDocument();
System.out.println(ts.getText(document));
有什么办法可以读出表格里面的内容吗?table里面的,我用的方法是读Text
还有其他的方式吗?例如用Itext那个能取出来吗?