c# 读取pdf中的表格数据

cww2010 2009-10-28 09:59:36
如果pdf里面有表格数据的话,想把它读出来,要如何做,最好给个例子。或是个什么开源插件。
...全文
991 15 打赏 收藏 转发到动态 举报
写回复
用AI写文章
15 条回复
切换为时间正序
请发表友善的回复…
发表回复
ycmrlq 2012-05-24
  • 打赏
  • 举报
回复
我也想知道怎么弄!
刚耐 2011-09-22
  • 打赏
  • 举报
回复
我可以直接把PDF全部读出来,但是表格就没办法控制,我现在也是对于表格很头疼
不知道有什么办法可以读出来
teralyn 2011-07-25
  • 打赏
  • 举报
回复
用一楼的方法读pdf若是只有文本信息的还好,一有图标的就完全无序了,问题如7楼。
msikruby 2010-05-13
  • 打赏
  • 举报
回复
帮顶,有结果通知下啊,我也急需啊
RamblingSoul 2010-03-20
  • 打赏
  • 举报
回复
呵呵
回来看看。
辉太郎 2009-11-04
  • 打赏
  • 举报
回复
学习
cww2010 2009-11-04
  • 打赏
  • 举报
回复
来人回答呀!
RamblingSoul 2009-10-29
  • 打赏
  • 举报
回复
不知道能不能读取整个页面出来。

格式什么的。。。
cww2010 2009-10-29
  • 打赏
  • 举报
回复
顶一个
daichenghua 2009-10-29
  • 打赏
  • 举报
回复
Lucene.Net.dll 这个也可以
CloudOfFly 2009-10-29
  • 打赏
  • 举报
回复
当然可以
你去看一下ITextSharp 这个组件的用法
cww2010 2009-10-29
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 wuyq11 的回复:]
可用itextsharp,pdfbox
string pdfPath = Server.MapPath("a.pdf");
    PDDocument doc = PDDocument.load(pdfPath);
    PDFTextStripper stripper = new PDFTextStripper();
    string txt = stripper.getText(doc);
    Response.Write(txt);

http://topic.csdn.net/u/20070607/11/b6ae0d30-3d2d-4024-9057-19583b1ac8b3.html
[/Quote]
这样是可以读出来文本和数据。如果里面有表格的话,我如何知道那个数据是哪列?
我想保留pdf里面的表格信息,大家看要如何弄?或是有什么办法能把表格从字符串是返原出来?
V68V6 2009-10-28
  • 打赏
  • 举报
回复
ITextSharp讨论
iTextSharp 使用详解
另外iTextSharp有中文教程来着,你搜一下,CSDN上有下载。。。不过资源分竟然要10分。我没好意思贴上来。。
threenewbee 2009-10-28
  • 打赏
  • 举报
回复
ITextSharp是开源的,从IText移植来的,很不错。
wuyq11 2009-10-28
  • 打赏
  • 举报
回复
可用itextsharp,pdfbox
string pdfPath = Server.MapPath("a.pdf");
PDDocument doc = PDDocument.load(pdfPath);
PDFTextStripper stripper = new PDFTextStripper();
string txt = stripper.getText(doc);
Response.Write(txt);

http://topic.csdn.net/u/20070607/11/b6ae0d30-3d2d-4024-9057-19583b1ac8b3.html

110,533

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧