社区
C++ 语言
帖子详情
是否能用C++写一个将PDF转换成文字?
LAST_MAN
2012-05-28 07:25:13
看到网络上的pdftoWord,都是将PFD剪成图片,然后放到word里面
我现在想写一个软件,能够讲pdf里的文字抽取出来,像我们打字一样复制到word里面
用户可以转换之后,对需要的文字进行复制,修改等操作
请问这个想法是否能实现?如果能,应该怎么实现?
...全文
150
6
打赏
收藏
是否能用C++写一个将PDF转换成文字?
看到网络上的pdftoWord,都是将PFD剪成图片,然后放到word里面 我现在想写一个软件,能够讲pdf里的文字抽取出来,像我们打字一样复制到word里面 用户可以转换之后,对需要的文字进行复制,修改等操作 请问这个想法是否能实现?如果能,应该怎么实现?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
pathuang68
2012-05-28
打赏
举报
回复
[Quote=引用 4 楼 的回复:]
引用 2 楼 的回复:
这个分两种情况了。一种PDF就是以文字形式保存的,这样的容易做出来。第二种就是PDF以图片形式保存的,这样从图片中提取文字是比较困难的
基本是第二种了,就是把一本书扫描出来的那种
[/Quote]
这样的话是非常有困难的,只能用OCR了,不能保证100%的正确。
jammymarse
2012-05-28
打赏
举报
回复
[Quote=引用 4 楼 的回复:]
引用 2 楼 的回复:
这个分两种情况了。一种PDF就是以文字形式保存的,这样的容易做出来。第二种就是PDF以图片形式保存的,这样从图片中提取文字是比较困难的
基本是第二种了,就是把一本书扫描出来的那种
[/Quote]
这样就很困了 坐等大牛
LAST_MAN
2012-05-28
打赏
举报
回复
[Quote=引用 2 楼 的回复:]
这个分两种情况了。一种PDF就是以文字形式保存的,这样的容易做出来。第二种就是PDF以图片形式保存的,这样从图片中提取文字是比较困难的
[/Quote]
基本是第二种了,就是把一本书扫描出来的那种
星星x
2012-05-28
打赏
举报
回复
楼上加1
W170532934
2012-05-28
打赏
举报
回复
这个分两种情况了。一种PDF就是以文字形式保存的,这样的容易做出来。第二种就是PDF以图片形式保存的,这样从图片中提取文字是比较困难的
iamdarkshine
2012-05-28
打赏
举报
回复
就是OCR啊
V
C++
将
pdf
文件转换为txt格式提取
文字
内容
改程序可将
pdf
文件转换为txt格式文件,便于提取
pdf
文件中的内容
Visual
C++
编程技巧精选500例.
pdf
203 如何使用BIG5显示
一个
字符串? 204 如何使字符串输出具有立体效果? 205 如何用省略号显示字符串的其余部分? 第11章 文件读
写
操作 206 如何打开文件? 207 如何关闭文件? 208 如何读文件? 209 如何
写
文件? 210 如何...
征服
C++
11视频精讲
【为什么还需要学习
C++
?】 你
是否
接触很多语言,但从来没有了解过编程语言的本质?... 提升篇: 本篇可以帮助学员更加高效的进行
c++
开发,其中包含类型转换、文件操作、异常处理、代码重用等内容。
C++
实现万能进制转换
本资源是一份详尽的
C++
实现进制转换的教程,旨在帮助读者理解并掌握
C++
语言在进制转换方面的应用。教程通过清晰易懂的
文字
说明和实例代码,深入讲解了二进制、八进制、十进制和十六进制之间的转换原理和实现方法。 ...
vc10获取
pdf
中的
文字
获取
pdf
中的text,完成全角字符到半角字符的转换
C++ 语言
64,642
社区成员
250,580
社区内容
发帖
与我相关
我的任务
C++ 语言
C++ 语言相关问题讨论,技术干货分享,前沿动态等
复制链接
扫一扫
分享
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
请不要发布与C++技术无关的贴子
请不要发布与技术无关的招聘、广告的帖子
请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下
试试用AI创作助手写篇文章吧
+ 用AI写文章