社区
图表区
帖子详情
从PDF文件中取得特定内容的问题
cshchina
2007-05-24 11:14:52
想在一个PDF文件中搜索一个特定的词,定位到该词后取得该词后面的内容
请问应该如何处理?
acrobat access lib和acrobat库都用过
我在vba中开发
谢谢
...全文
266
5
打赏
收藏
从PDF文件中取得特定内容的问题
想在一个PDF文件中搜索一个特定的词,定位到该词后取得该词后面的内容 请问应该如何处理? acrobat access lib和acrobat库都用过 我在vba中开发 谢谢
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
5 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
lxmfll2000
2007-05-31
打赏
举报
回复
不太容易。
forgot
2007-05-25
打赏
举报
回复
並不是每種PDF文件都能搜索文本的,掃描(如ScanWizard)產生的PDF實際是圖像位元的組合,是無法搜索文本的,某些特定的軟件(如Acrobat Distiller)產生的PDF才可以搜索特定文本。具體怎麼搜索你可以參考http://www.codeproject.com/cs/internet/Searcharoo_4.asp,有詳盡的教程,有Demo和源碼,應該能滿足你的需要。
winsei
2007-05-25
打赏
举报
回复
把整个PDF文档中的内容全部拆分成单个的词组或单词,并且建立索引,按索引进行搜索。
rategy
2007-05-25
打赏
举报
回复
不清除,不知道vba能不能调用函数库。
为什么不用vb呢?
java 读取
PDF
文件
中
的
内容
在Java编程环境
中
,读取
PDF
文件
中
的
内容
是一个常见的任务,特别是在处理文档自动化或者数据分析时。
PDF
(Portable Document Format)是一种跨平台的
文件
格式,用于精确地保留文档的格式和
内容
。下面将详细介绍如何...
itextsharp.ExtractImagesFrom
PDF
.zip
在这个
特定
的实例
中
,它被用来从
PDF
文件
中
抽取并保存单独的图像
文件
。 【描述】"从
PDF
中
提取图片的项目实例,用VS2008可以直接运行。"表明这是一个针对Visual Studio 2008的C#项目,用户无需额外设置即可直接运行。...
Thymeleaf
中
文文档合集-最新版
Thymeleaf支持通过`th:text="#{message}"`来获取应用
中
的国际化消息,其
中
`#{}`是消息表达式,可以从资源配置
文件
中
查找对应的语言字符串。 6. **Spring集成** 在Spring环境
中
,Thymeleaf可以通过`thymeleaf-...
nh格式
文件
浏览器
在IT行业
中
,一个专业的
文件
浏览器不仅需要能够打开和查看
文件
,还应具备一些关键功能,如搜索、书签、缩略图预览、全文检索等,以便用户能够高效地导航和获取信息。对于NH格式
文件
浏览器来说,它可能还支持其他高级...
跟我一起学Makefile(
PDF
版)
此外,还有一系列内置函数,如$(wildcard)用于获取当前目录下的所有匹配模式的
文件
,$(filter-out)用于过滤出列表
中
的部分元素。 5. **隐含规则**:Makefile
中
存在许多预定义的隐含规则,例如,它知道如何编译.c...
图表区
4,819
社区成员
14,134
社区内容
发帖
与我相关
我的任务
图表区
.NET技术 图表区
复制链接
扫一扫
分享
社区描述
.NET技术 图表区
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章