c#　读取pdf中的表格数据

cww2010 2009-10-28 09:59:36

如果pdf里面有表格数据的话，想把它读出来，要如何做，最好给个例子。或是个什么开源插件。

...全文

1044 15 打赏收藏转发到动态举报

写回复

用AI写文章

15 条回复

切换为时间正序

请发表友善的回复…

发表回复

ycmrlq 2012-05-24

打赏
举报

我也想知道怎么弄！

刚耐 2011-09-22

打赏
举报

我可以直接把PDF全部读出来,但是表格就没办法控制,我现在也是对于表格很头疼
不知道有什么办法可以读出来

teralyn 2011-07-25

打赏
举报

用一楼的方法读pdf若是只有文本信息的还好，一有图标的就完全无序了，问题如7楼。

msikruby 2010-05-13

打赏
举报

帮顶，有结果通知下啊，我也急需啊

RamblingSoul 2010-03-20

打赏
举报

呵呵
回来看看。

辉太郎 2009-11-04

打赏
举报

学习

cww2010 2009-11-04

打赏
举报

来人回答呀！

RamblingSoul 2009-10-29

打赏
举报

不知道能不能读取整个页面出来。

格式什么的。。。

cww2010 2009-10-29

打赏
举报

顶一个

daichenghua 2009-10-29

打赏
举报

Lucene.Net.dll 这个也可以

CloudOfFly 2009-10-29

打赏
举报

当然可以
你去看一下ITextSharp 这个组件的用法

cww2010 2009-10-29

打赏
举报

[Quote=引用 1 楼 wuyq11 的回复:]
可用itextsharp,pdfbox
string pdfPath = Server.MapPath("a.pdf");
PDDocument doc = PDDocument.load(pdfPath);
PDFTextStripper stripper = new PDFTextStripper();
string txt = stripper.getText(doc);
Response.Write(txt);

http://topic.csdn.net/u/20070607/11/b6ae0d30-3d2d-4024-9057-19583b1ac8b3.html
[/Quote]
这样是可以读出来文本和数据。如果里面有表格的话，我如何知道那个数据是哪列？
我想保留pdf里面的表格信息，大家看要如何弄？或是有什么办法能把表格从字符串是返原出来?

V68V6 2009-10-28

打赏
举报

ITextSharp讨论
iTextSharp 使用详解
另外iTextSharp有中文教程来着，你搜一下，CSDN上有下载。。。不过资源分竟然要10分。我没好意思贴上来。。

threenewbee 2009-10-28

打赏
举报

ITextSharp是开源的，从IText移植来的，很不错。

wuyq11 2009-10-28

打赏
举报

可用itextsharp,pdfbox
string pdfPath = Server.MapPath("a.pdf");
PDDocument doc = PDDocument.load(pdfPath);
PDFTextStripper stripper = new PDFTextStripper();
string txt = stripper.getText(doc);
Response.Write(txt);

http://topic.csdn.net/u/20070607/11/b6ae0d30-3d2d-4024-9057-19583b1ac8b3.html