PDF区域文本提取工具

小小明-代码实体 2021-11-26 17:21:17
加精

PDF区域文本提取工具
https://blog.csdn.net/as604049322/article/details/121559235
当前文章的标题和链接已复制到剪切版,取消点击复制的复选框选项可取消此操作
发布时间:2021-11-26 14:25:22,阅读数:192,点赞数:27,评论数:5
{'原创': 151, '周排名': 13, '总排名': 261, '访问': 5843318, '等级': 8, '积分': 27456, '粉丝': 16575, '获赞': 13111, '评论': 5693, '收藏': 15562}
专栏和标签:['gui图形化工具', 'python', 'PDF', 'gui'],阅读数:195,点赞数:27,评论数:5,收藏数:22
文章内容:
我们在用代码不断测试区域范围时还挺需要感觉的 试想如果我们可以开发一个图像化工具 直接鼠标框选提取区域就精准的太多了 不需要不断的测试 经过几天的研究 完全不会wxpython总算是实现了一个非常精简的图像化的PDF区域选择提取工具 整体效果如下 功能简介打开软件后界面如下 点击打开文件按钮打开之前的PDF文件后效果如下 框选区域后 标题栏会自动显示当前框选的区域提取到的文字 还可以左右按钮切换 实际我们需要提取文字的区域可能不止这一个 所以程序支持多区域框选 完成区域框选后就可以点击保存文件 将PDF每页提取到的文本保存到一个csv文件中 当前选区的保存结果如下 可以看到已经按框选顺序依次保存了每一个区域的字符串 如果选择区域时发现提取结果不准确 可以撤销后重新选择 保存图片则会将PDF的每页的整体保存为一张图片 未选择区域时 以页码为文件名保存图片 选择区域时 会自动提取最后一个区域提取的文本作为当前页的文件名 开发代码当然这个项目由于本人是一次使用wxpython 功能非常简约 现在将完整代码开源出来期待各位大佬的改进

...全文
27 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
万兴PDF编辑器是一个非常容易使用的PDF编辑工具。在万兴PDF编辑器的帮助下,您可以添加、删除、剪切、复制、粘贴、编辑、编辑图片和许多其他操作到现有的PDF文档中。您还可以从各种格式的文档中创建PDF,如word、excel、ppt、图片、txt等。不仅如此,您还可以将PDF转换成可编辑的文档格式,并且还可以将各种文档合并成一个PDF文档。该软件功能非常全面,也非常容易使用。 软件截图: 软件功能: PDF文件编辑。打开PDF文档并打开PDF编辑模式,以修改PDF文档的文本并更改字体、字号和颜色。编辑图像和其他对象,随意拖动或移动要编辑的对象,自由添加和调整图像的大小,选择图像的位置,剪辑图像,多图片对齐等。 PDF格式转换。它支持将一个或多个PDF文件转换成各种其他格式的文件。转换后的文件质量很高,包括Powerpoint、Word、Excel、HTML、JPEG、TXT、RTF等格式。 PDF图片转文字。通过光学字符识别(也称为OCR识别),图像或打印文本可以转换为机器可读文本,识别精度高于同行。 PDF文件签名。对于所有需要签名的文档,数字签名比纸质签名更方便,可以有效保护文档安全。 PDF文档数据提取。在处理电子发票等格式相同的电子单据时,只要选择要提取区域,所有单据中的区域数据都可以批量导出。 软件特色: 创建一个可填写的PDF表格 只需单击一下,任何在Word、Excel或其他Office应用程序中生成的现有平面表单都可以转换为可填充的可编辑PDFPDF格式转换 拖放鼠标,将PDF格式转换为PPT、Word、Excel、HTML、JPEG、PNG和其他格式。可以批量处理500多份文件。 文档注释和注释 在您想要的任何地方添加注释和文本框。用高亮、叉号和下划线标记文档以供审阅。 文档拆分和提取 将一个多页的PDF文档分成几个较小的文件,或者从文档中提取一个指定的页面来生成一个单独的PDF文档。 添加贝茨代码 为文档添加可定制的贝茨数字,以便于索引和检索。 表单自动识别数据提取 智能表单自动化技术可以在几秒钟内将数百个相同表单的PDF表单数据提取到一个可编辑的Excel表单中。 添加水印、背景、页眉和页脚 轻松添加和删除文本和图片水印、背景、页眉和页脚,允许您完全自定义创建的PDF文件。 密码和密文保护 使用高度机密的256位AES加密密码保护PDF文件,并设置锁定特定功能,如查看、打印、编辑、填充和旋转。
iSkysoft PDF Editor 6 Pro是由 iSkysoft 公司研制开发的一款功能强大的多功能PDF编辑器软件,它提供了一个用于编辑PDF文件的完整的工具箱,包括识别,加密,以及转换、旋转与合并、OCR PDF 等功能。iSkysoft PDF Editor 6 Pro软件赋予您对您PDF文件的完全控制权,您可以从简单的任务入手,如插入、删除、旋转、裁剪、分割、提取添加水印、背景变化,自由地使用这些文档内含有的一切。通过使用iSkysoft PDF Editor 的神奇接口,你可以插入重要批示,强调主要业务,并绘制能够使您网页更具描述性的形状和线条。“注释”功能使您能够在您可以插入文本意见和便签的地方作标记,还有一套体验良好的为用户准备的,包括正方形,圆形等制备的标记绘图工具。甚至您还可以突出显示使用“文本高亮显示”和“区域选中”文本按钮。iSkysoft PDF Editor软件可以让你编辑PDF文档就如同编辑Word文档一样轻松随意,并完全兼容使用Adobe Acrobatpdf文件。你可以使用它编辑文档、插入注释、OCR扫描、加上下划线等、突出显示、绘图功能、铅笔功能等,并可加入图片、超链接、文字、书签、甚至水印!iSkysoft PDF Editor 软件支持删除页面、提取页面、裁剪页面、旋转页面、合并文档、分割文档的功能,并具备强大的转换功能,它可以将PDF文档转换为Word、Excel、powerpoint、图像或者EPUB、Html网页格式、TXT文本格式和RTF富文本格式。iSkysoft PDF Editor 软件甚至还可以支持从其他文件导入直接创建PDF的功能,并允许你给PDF文档加上密码!
iSkysoft PDF Editor 6 Pro是由 iSkysoft 公司研制开发的一款功能强大的多功能PDF编辑器软件,它提供了一个用于编辑PDF文件的完整的工具箱,包括识别,加密,以及转换、旋转与合并、OCR PDF 等功能。iSkysoft PDF Editor 6 Pro软件赋予您对您PDF文件的完全控制权,您可以从简单的任务入手,如插入、删除、旋转、裁剪、分割、提取添加水印、背景变化,自由地使用这些文档内含有的一切。通过使用iSkysoft PDF Editor 的神奇接口,你可以插入重要批示,强调主要业务,并绘制能够使您网页更具描述性的形状和线条。“注释”功能使您能够在您可以插入文本意见和便签的地方作标记,还有一套体验良好的为用户准备的,包括正方形,圆形等制备的标记绘图工具。甚至您还可以突出显示使用“文本高亮显示”和“区域选中”文本按钮。iSkysoft PDF Editor软件可以让你编辑PDF文档就如同编辑Word文档一样轻松随意,并完全兼容使用Adobe Acrobatpdf文件。你可以使用它编辑文档、插入注释、OCR扫描、加上下划线等、突出显示、绘图功能、铅笔功能等,并可加入图片、超链接、文字、书签、甚至水印!iSkysoft PDF Editor 软件支持删除页面、提取页面、裁剪页面、旋转页面、合并文档、分割文档的功能,并具备强大的转换功能,它可以将PDF文档转换为Word、Excel、powerpoint、图像或者EPUB、Html网页格式、TXT文本格式和RTF富文本格式。iSkysoft PDF Editor 软件甚至还可以支持从其他文件导入直接创建PDF的功能,并允许你给PDF文档加上密码!

91,749

社区成员

发帖
与我相关
我的任务
社区描述
关注公众号「一条coding」获取Java学习路线和100本计算机书籍
社区管理员
  • 一条coding
  • 曲鸟
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

发帖、点赞、评论可获得积分,被加精更有额外积分奖励。

积分榜第一可获得CSDN定制手机壳。

加入交流群每日打卡还有机会获得掘金马克杯。

试试用AI创作助手写篇文章吧