社区
C#
帖子详情
请问如何通过C#将一个PDF文件里的文字内容提取出来?
jsking
2005-07-25 04:59:34
可以做到吗 ?如果可以的话能给出例子吗 ?谢谢各位高手了。
...全文
920
21
打赏
收藏
请问如何通过C#将一个PDF文件里的文字内容提取出来?
可以做到吗 ?如果可以的话能给出例子吗 ?谢谢各位高手了。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
21 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
weixing979
2006-06-28
打赏
举报
回复
这个帖子快一年了,还不结啊
anan221
2006-06-28
打赏
举报
回复
学习
oooomygod
2006-06-28
打赏
举报
回复
EasyPDF(PDF):打不开
EasyPDF
2006-06-28
打赏
举报
回复
http://easypdf.googlepages.com/home
oooomygod
2006-06-27
打赏
举报
回复
http://www.cpdf.net/bbs/index.asp?boardid=12
PDF在线可以打开,但是保存下来就不能打开了
竟然还不能下载来看,有没有什么软件可以破的破了他
_NET2004
2005-07-27
打赏
举报
回复
去找ADOBE公司吧
mokermo
2005-07-27
打赏
举报
回复
关注
givenchy
2005-07-27
打赏
举报
回复
难。
hawk5456
2005-07-27
打赏
举报
回复
ding
jsking
2005-07-27
打赏
举报
回复
给顶上去啊,急~~~~~
weixing979
2005-07-27
打赏
举报
回复
关注一下
jarde_jarde
2005-07-27
打赏
举报
回复
关注
孟子E章
2005-07-27
打赏
举报
回复
Extract Text from PDF File
http://www.codeproject.com/Purgatory/DotNetPDF.asp
jsking
2005-07-27
打赏
举报
回复
屏幕取词是可以,但我问题的出发点是这样的:就是通过程序批量的把PDF文件里的文字直接导入到数据库里面去啊
hsonjr
2005-07-27
打赏
举报
回复
我认为可以。
但可能要用到屏幕取词的知识。
最近用了一工具,Aqua Deskperience,可以取词也可以取图。
epngllh
2005-07-26
打赏
举报
回复
我也想知道啊.现在我更想得到怎么样把word文档转成pdf文档,呵呵
zeusvenus
2005-07-26
打赏
举报
回复
这种东西应该看ADOBE公司有没有提供现成的编程接口或者控件什么的,否则比较麻烦。
楼主可以看看PDF的白皮书看上面写了没有。
zeax
2005-07-26
打赏
举报
回复
应该很难以做到
jack1026
2005-07-26
打赏
举报
回复
谁知道,我到想见世见世!
JzeroBiao
2005-07-25
打赏
举报
回复
学习.
加载更多回复(1)
c#
开发
pdf
文件
拆分、转图片;
pdf
、图片
内容
提取
,ocr
文字
识别技术,tesseract。
将
pdf
按页拆分成多个小的
pdf
,并可将
pdf
转换成jpeg图片,同时具有OCR
文字
识别功能,可
提取
pdf
和图片中的
内容
,内置图片识别区域设置。
C#
生成
PDF
读取
PDF
文本
内容
获取
PDF
内图片(亲测可用)
C#
生成
PDF
读取
PDF
文本
内容
获取
PDF
内图片(亲测可用)
开源
Pdf
Sharp
提取
读取
PDF
文档
里
text
内容
方法
开源
Pdf
Sharp
提取
读取
PDF
文档
里
text
内容
方法
C#
提取
PDF
文字
内容
1、
pdf
为word转换的
内容
,非图片
pdf
。 2、
提取
到的
文字
内容
为字符串,可以和所需
内容
比较。 3、背景介绍:签订合同时,需要第三方签字、加盖印章。当第三方返回
文件
有误,如买卖双方签字人发生改变。实际生产中已经出现该问题,合同A发到三方加盖印章,返回了合同B的
内容
,因为未检查合同中的买卖双方签字人信息,因此导致合同存档有问题,因此做
一个
小的核验,确保三方返回
内容
中买卖双方信息一致。 4、写demo过程中,寻找了几个资源,如
PDF
Box,Spire.
Pdf
(free版本,限制10页),iTextSharp;该解决方案都有涉及。
C#
pdf
box解析
pdf
文字
及图片(源码)
最近项目使用
C#
解析
PDF
,此程序主要利用
PDF
BOX
提取
PDF
中
文字
及图片。
C#
解析
PDF
相关资料太少了,研究了好多天,现在放上来,希望朋友们少走些弯路。适用于未加密的
PDF
。
C#
110,538
社区成员
642,577
社区内容
发帖
与我相关
我的任务
C#
.NET技术 C#
复制链接
扫一扫
分享
社区描述
.NET技术 C#
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
让您成为最强悍的C#开发者
试试用AI创作助手写篇文章吧
+ 用AI写文章