如何将pdf中表格按原始相对位置转到excel中?

xiaocui2007 2012-10-23 08:51:03
1、pdf为扫描版,可以复制其内容,Win7 x64
2、网上转换软件AnyBizSoft PDF Converter、VeryPDF等要么无法转换,要么是乱码很多。
3、我用第三方插件Pdfbox写的程序,转换结果乱码很多,占到一半。
4、求其他更好的转换方法,要求转换结果如下图(内容位置尽量和原来相同)。
原始扫描pdf:
<img src=http://img.my.csdn.net/uploads/201210/23/1350953511_9352.jpg” />
要求转换结果:
<img src=http://img.my.csdn.net/uploads/201210/23/1350953511_4031.jpg" />
...全文
439 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
刘文化 2013-03-14
  • 打赏
  • 举报
回复
如果你是临时有这个PDF文件,需要做成excel表格,我建议你还是手工做一下。 如果你是单位有这样的需求,建议由单位出面购买一套PDF库,需要一定的定制开发。因为PDF里面是没有“表格”的概念的,只会识别你文件中的横线、竖线、文字。这个PDF库负责提取指定位置的文本,然后调用微软接口,把对应文本放在excel中适合的单元格。
fuwaninijing 2013-03-13
  • 打赏
  • 举报
回复
最后怎么解决的啊
hypernovaservice 2012-10-24
  • 打赏
  • 举报
回复
我有PdfLibrary,可惜不能公开给你.如果你需要的量大的话,我可以开个WebService,大家合作合作
xiaocui2007 2012-10-24
  • 打赏
  • 举报
回复
哪位大虾指点一下!
xiaocui2007 2012-10-23
  • 打赏
  • 举报
回复
期待高手的解决方案!
xiaocui2007 2012-10-23
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 的回复:]

你要求转换的结果呢不是jpg跟Excel哪有关系?
参考
http://topic.csdn.net/u/20120219/20/4888d128-3b77-47bc-aa21-cb02c014bc1f.html
[/Quote]
我的pdf不是图片,是文本的,可以复制上面的内容的,我想转成excel或者没有乱码的text也行

蝶恋花雨 2012-10-23
  • 打赏
  • 举报
回复
你要求转换的结果呢不是jpg跟Excel哪有关系?
参考
http://topic.csdn.net/u/20120219/20/4888d128-3b77-47bc-aa21-cb02c014bc1f.html
xiaocui2007 2012-10-23
  • 打赏
  • 举报
回复
原始扫描pfd:
<img src=http://img.my.csdn.net/uploads/201210/23/1350953511_9352.jpg” />
要求转换结果:
<img src=http://img.my.csdn.net/uploads/201210/23/1350953511_4031.jpg" />
文名: 专业PDF转换Word/PPT/Excel工具 英文名: AnyBizSoft PDF Converter V 2.02 资源格式: 压缩包 版本: 绿色版 发行时间: 2010年08月13日 制作发行: AnyBizSoft 地区: 美国 语言: 英文 简介: 软件类型:软件/应用软件 软件性质:绿色软件 操作系统: Windows 应用平台:Windows xp/Windows vista/Windows 7 问题反馈:http://www.anypdftools.com/pdf-converter-specification.html 网站链接:http://www.anypdftools.com/pdf-converter-specification.html 版本说明:集成PDF转换Excel功能、无需安装 Microsoft Office 即可转换、自动识别表格 软件介绍 AnyBizSoft PDF Converter 是一个专业的PDF转换器,支持将PDF转换为 Word (DOC/DOCX)、PowerPoint (PPT/PPTX)、Excel (XLS/XLSX)、HTML、TXT 等格式。经测试 AnyBizSoft PDF Converter 对文字符(简繁文)支持良好,转换效果也不错,能够保存原有PDF的页面布局、图片、超链接等信息;对于加密或密码保护的PDF文件。 AnyBizSoft PDF Converter 也能轻松转换当前版本 AnyBizSoft PDF Converter v2.0.2,该版本有较大变化,如集成PDF转换Excel功能、无需安装 Microsoft Office 即可转换、自动识别表格等,推荐更新;而作为PDF转换软件厂商,免费的 AnyBizSoft PDF to Text 也是必须的了,若只需要PDF转Word功能,则可以试用 AnyBizSoft PDF to Word Converter。 主要特点 支持的格式, 输入:Adobe PDF 1.0 - 170格式(PDF)。 输出:word 2003/2007/2010(.doc,.docx),Excel 2003/2007/2010内容,.xlsx),(2003/2007/2010(.ppt,.pptx PowerPoint),HTML格式(任何)、文本格式(.txt)。 精确的保藏 保存原始的设计,表列文本、图形、图像和链接,之后,从PDF Word,Excel,PowerPoint和HTML。没有必要再或者格式化转换的文件。文档转换后,可以提取图像优于单独出去,你可以插入图片到e xcel试算表轻松、灵活 高效转换模式 批次转换的——-Convert 200 PDF文件在同一时间 部分转换——-任何页面的PDF档案转换 非常容易使用 友好的用户界面 支持PDF文件在10种语言:英语、土耳其、泰国、拉丁语、韩国、希腊、西里尔语、阿拉伯语、日语和汉语 操作系统要求 操作系统:Windows 7/XP/Vista/2003 32bit 最低要求的软件:Microsoft PowerPoint 2010/2007/ 最小的硬件要求500: MHz processor, 256 MB Memory, 15 MB hard disk space 使用必读 1.运行 !)Install.bat 进行初始化(Vista/Windows 7请右键以管理员权限运行) 2.双击 PDFConverter.exe 进入主程序,当前版本为 AnyBizSoft PDF Converter v2.02 3. 若提示注册,请输入以下注册信息: Licensed e-mail: bidjan@ziggo.nl Registration code: 91D2F5AC2B939D43A875 注意 Vista/Windows 7 必须右键以管理员权限运行 PDFConverter.exe,否则可能会提示失败 [安全检测] 已经过安全检测。 杀毒软件: NOD32 病毒库版本:5363(20100813)
iStonsoft PDF Converter 2.8.78 文版是一个7合1的PDF转换工具,它能够转化为PDF格式ePub格式,PowerPointExcel和Word,文本,HTML和图像没有任何质量损失。有了这个经济实惠但功能强大的程序,您可以根据您的需要自由选择输出格式为TXT,JPEG,PNG,GIF,BMP,TIF,EPUB,HTML和Word。通过使用iStonsoft PDF转换器,您可以享受快速,易于转换只用点击几下鼠标。 PDF 文档转换工具 iStonsoft PDF Converter 文多语特别版PDF 文档转换工具 iStonsoft PDF Converter 文多语特别版 PDF格式转换为7+格式准确地 *将PDF转换为ePub格式:所以,你可以阅读PDF像苹果的iPad,iPhone,iPod的触摸,索尼阅读器,角落和基于Android的手机/设备的ePub友好的设备。 *转换PDF到Microsoft Office(Word,PowerPoint和Excel):通过使用它,您可以将您的PDF文件转换成格式良好的和可编辑的Word,PowerPoint演示文稿,以秒为单位的Excel电子表格。 * PDF格式转换为图像:转换PDF到流行的图像格式,如JPG/ JPEG,GIF,TIFF,PNG和BMP。 * PDF格式转换为HTML:从PDF转换为网页,以查看或在很多浏览器,如IE,火狐,Safari,歌剧等分享您的PDF内容 *将PDF转换为文本:从提取轻松只读PDF文件的文本。 高转换速度和良好的转换质量 *批量转换:拖放多个文件的程序,并将其转换为PDF格式,在同一时间,而不会削弱快速的转换速度。 100页的PDF文件可以在几秒钟内转换。 *大保鲜:转换后,所有的原始文本,图像,图形,表格,超链接,布局和格式将被精确保存在输出PDF文件。你看到的是你会得到什么。 预览功能和有益的部分转换模式 *部分转换:在额外的高效批量转换模式,iStonsoft PDF转换器还提供了智能部分转换,你可以灵活转换的PDF选定的页面或页面范围,通过输入页码或页面范围。 *预览功能:这里是一个小预览窗口,您可以通过网页预览导入PDF文件,网页,这样你就能够确认需要转换的页面,它可以做一个大忙的部分转换模式。 右边的文件管理工具,使您的生活更轻松 *整个PDF转换任务可以在3个简单的步骤来完成:导入PDF文件,输出格式选择,并开始转换。只需要3鼠标点击。 *免费指导和技术支持,提供了软件的使用过程再次向所有的麻烦。 *独立的应用程序:独立工作不受任何第三方软件,如Adobe Acrobat的帮助。

110,539

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧