我想利用M$的IFilter提取DOC/PDF的文本,怎么做,谢谢。

cnstar9988 2005-06-27 03:10:48
我想利用M$的IFilter提取DOC/XLS/PDF的文本,怎么做,谢谢。
有没有例子,谢谢。

...全文
94 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
cnstar9988 2005-06-30
  • 打赏
  • 举报
回复
有没有例子,谢谢.
wangweixing2000 2005-06-29
  • 打赏
  • 举报
回复
只支持下面几种格式,好像没有xls和pdf对应的dll。没有例子!关注一下!
mimefilt.dll Filters Multipurpose Internet Mail Extension (MIME) files.
nlhtml.dll Filters HTML 3.0 or earlier files.
offfilt.dll Filters Microsoft Office files: Microsoft Word, Microsoft Excel, and Microsoft PowerPoint®.
query.dll Filters plain text files (default filter) and binary files (null filter).
bobob 2005-06-29
  • 打赏
  • 举报
回复
可以单独做个抽取pdf的程序
cnstar9988 2005-06-29
  • 打赏
  • 举报
回复
offfilt.dll可以支持xls,pdf的单独下载就可以了。
关键是怎么调用这些dll,谢谢。

3,245

社区成员

发帖
与我相关
我的任务
社区描述
ATL,Active Template Library活动(动态)模板库,是一种微软程序库,支持利用C++语言编写ASP代码以及其它ActiveX程序。
社区管理员
  • ATL/ActiveX/COM社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧