如何进行word和pdf文档到普通文本的转换

Lugonix 2004-09-15 02:12:25
在开发中,想进行word文档和pdf文档进行到txt文档的转换,可都遇到了问题,请大家帮忙。
在进行word-》txt转换时用的是已经在系统注册的word的一个com组件,可是每次转换都会生成一个word进程,可是在我们进行多线程大量转换时,有时候会出现word进程占有大量的cpu资源,怎么也释放不掉的现象,而且这个进程也不会自己杀掉。
在进行pdf-》txt转换时,用的时别人的组件,转换5。0和以下版本,没有问题,但是到了6。0版本的文档,这个中文就全成了乱码。(我装有中文的6.0)
请那位高手指教一下,哪里有组件,源代码也可以,语言c#最好,其他的也可以了。
...全文
186 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
Lugonix 2004-09-16
  • 打赏
  • 举报
回复
tocaiyajun512(小秀) :
我用的也是这样的方法,可是假如同时有比较多的这种需要转换的线程启动,那么cpu的占用率岂不是很高??
gxg2004csdn 2004-09-16
  • 打赏
  • 举报
回复
up
athossmth 2004-09-16
  • 打赏
  • 举报
回复
word2003支持xml提取内容。
Lugonix 2004-09-16
  • 打赏
  • 举报
回复
那有没有什么好的办法??
那么html->text呢??
caiyajun512 2004-09-15
  • 打赏
  • 举报
回复
用ms的word类型库能做到word到各种文档的转化.
2003--11.0
2002(xp)--10.0
2000--9.0
----------------------------
关闭:c#
object omissing=Type.value.missing;
word.quit(ref omissing,ref omissing,ref omissing);
if(word!=null)
{
word=null;
}
GC.Collect;//垃圾回收.
khpcg 2004-09-15
  • 打赏
  • 举报
回复
估计是别人的组件只支持到5。0和以下版本

110,555

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧