C# 怎么读取PDF文件内容?

yangxuan849 2008-09-20 11:19:17
怎么能读取到PDF文件里的内容信息,PDF为全英文文本格式 无图片类的东西..
我怎么才能读取到所有信息 然后保存到字符串里面..?
...全文
1788 11 打赏 收藏 转发到动态 举报
写回复
用AI写文章
11 条回复
切换为时间正序
请发表友善的回复…
发表回复
言多必失 2012-07-24
  • 打赏
  • 举报
回复
到底解决没有啊?
CXZ84 2008-12-19
  • 打赏
  • 举报
回复
Hi, 我下了PDFBox-0.7.3.zip 了,可是解压后怎么找不到上面说的那些DLL文件呢〉?我想做的事是:把PDF中的内容读出来,然后把读出来的内容放入一个TXT文本中,会的朋友可以帮我下么?谢谢!
XPingguo 2008-09-20
  • 打赏
  • 举报
回复
搜索 PDFBox-0.7.3.zip
hyblusea 2008-09-20
  • 打赏
  • 举报
回复
wowosbpro 2008-09-20
  • 打赏
  • 举报
回复
受教了,我也正想这问题呢
豆丁_ 2008-09-20
  • 打赏
  • 举报
回复
楼上正解
XPingguo 2008-09-20
  • 打赏
  • 举报
回复
下载 PDFBox-0.7.3.zip

PDFBox-0.7.3.dll
lucene-demos-2.0.0.dll
lucene-core-2.0.0.dll
bcmail-jdk14-132.dll
bcprov-jdk14-132.dll
FontBox-0.1.0-dev.dll
ICSharpCode.SharpZipLib.dll
IKVM.AWT.WinForms.dll
IKVM.GNU.Classpath.dll
IKVM.Runtime.dll
ikvm-native.dll
放入Bin中


<%@ Page Language="C#" %>
<%@ Import Namespace="System" %>
<%@ Import Namespace="org.pdfbox.pdmodel" %>
<%@ Import Namespace="org.pdfbox.util" %>
<script language="C#" runat="server">
protected void Page_Load(object sender, System.EventArgs e)
{
string pdfPath = Server.MapPath("index.pdf");
PDDocument doc = PDDocument.load(pdfPath);
PDFTextStripper stripper = new PDFTextStripper();
string txt = stripper.getText(doc);

Response.Write(txt);
}
</script>
sageking2 2008-09-20
  • 打赏
  • 举报
回复
关注!估计应该用PDF编辑器提供的类的.微软自己肯定不会做,毕竟PDF对Word有竞争的.
yangxuan849 2008-09-20
  • 打赏
  • 举报
回复
还有没有其它解决方案的啊?````
最好能给段代码看下

110,534

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧