需要读取中文PDF文件中的文本

pxboy 2007-04-22 09:38:17
请教各位,我只需要读取文本,不需要任何其他格式,有现成类库或代码可以用吗?
...全文
554 15 打赏 收藏 转发到动态 举报
写回复
用AI写文章
15 条回复
切换为时间正序
请发表友善的回复…
发表回复
星羽 2007-06-04
  • 打赏
  • 举报
回复
不知道能不能蹭到分
pxboy 2007-06-04
  • 打赏
  • 举报
回复
谢谢诸位,我现在可以用xpdf来读PDF中的中文文本了,xpdf是开源的。
Golden_Tiger 2007-05-20
  • 打赏
  • 举报
回复
有点意思
EasyPDF 2007-05-16
  • 打赏
  • 举报
回复
我有实现这样功能的控件,请和我联系
easypdf@gmail.com
spofmy 2007-05-15
  • 打赏
  • 举报
回复
学习了
VCLIFE 2007-04-24
  • 打赏
  • 举报
回复
PDF也能弄出字来,帮顶,学习,不过我就是知道那个超星阅览器上的那个什么识别能把字弄出来,不过是一堆又一堆的乱码........
wangzhangyong411 2007-04-24
  • 打赏
  • 举报
回复
呵呵用com库开发就没意思了

要自己写才有味道嘛

支持楼主自己写。。。。

pass86 2007-04-24
  • 打赏
  • 举报
回复
jixingzhong(瞌睡虫·星辰) 看来说的差不多了,学习。
celftj 2007-04-24
  • 打赏
  • 举报
回复
刚才我在百度搜了下 "PDF 开源",发现有不少开源软件啊
pxboy 2007-04-24
  • 打赏
  • 举报
回复
谢谢jixingzhong(瞌睡虫·星辰)
请问哪位有示例代码吗?
VCLIFE 2007-04-22
  • 打赏
  • 举报
回复
帮顶,我也想知道
jixingzhong 2007-04-22
  • 打赏
  • 举报
回复
如果是VC下开发,
最合适的可能就是使用 adobe acrobat 提供的 COM接口 了 ~

http://partners.adobe.com/public/developer/acrobat/sdk/index.html
jixingzhong 2007-04-22
  • 打赏
  • 举报
回复
http://www.pdflib.com/

另外,推荐去 sourceforge 寻找PDF相关的工程。
同时也有很多这方面的控件可用,
比如:http://www.evget.com/Product/10771/
也可以找一下
jixingzhong 2007-04-22
  • 打赏
  • 举报
回复
PDFlib
  • 打赏
  • 举报
回复
pdf好像有 二次开发包

64,639

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧