社区
脚本语言
帖子详情
python提取pdf与word中的相关信息
Marvel90
2012-11-16 03:58:56
对于正式发表的电子版pdf和word论文,需要用python脚本从文件的文本中提取其中的标题、作者、摘要、keyword信息,不考虑图片形式的pdf,数据量不大,效率重要度不大,已了解pypdf和pdfminer,不知如何实现,大家能否给个思路,谢谢!
...全文
838
3
打赏
收藏
python提取pdf与word中的相关信息
对于正式发表的电子版pdf和word论文,需要用python脚本从文件的文本中提取其中的标题、作者、摘要、keyword信息,不考虑图片形式的pdf,数据量不大,效率重要度不大,已了解pypdf和pdfminer,不知如何实现,大家能否给个思路,谢谢!
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
willgowell
2015-07-18
打赏
举报
回复
楼主的问题解决了么?我现在也是遇到了像楼主一样的问题
zhaoqfeng
2012-12-07
打赏
举报
回复
work可使用win32com吧
Gloveing
2012-11-17
打赏
举报
回复
pdf:看pypdf和pdfminer的开发文档 word:使用其COM接口
python
提取
PDF
与
Word
中
图片
python
提取
PDF
与
Word
中
图片,并结合GUI框架PysimpleGUI,做一个多文件图片
提取
软件并打包。
pdf
2
word
,60行代码实现多线程
PDF
转
Word
pdf
2
word
,60行代码实现多线程
PDF
转
Word
,
python
python
批量
提取
pdf
表格与文字
python
批量
提取
pdf
表格与文字,要求
pdf
格式不能是图片转的,也不能是加密的,就可以使用这个代码
提取
python
操作excel、
word
、
pdf
大全 完整版
python
操作excel、
word
、
pdf
大全 完整版
Python
实现导出
Word
文档
中
的所有图片、嵌入的文件
具体使用方法,实现过程参考我的
相关
博客:
Python
批量导出
word
文档
中
的图片、嵌入式文件
脚本语言
37,743
社区成员
34,212
社区内容
发帖
与我相关
我的任务
脚本语言
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
复制链接
扫一扫
分享
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
试试用AI创作助手写篇文章吧
+ 用AI写文章