如何进行word和pdf文档到普通文本的转换
在开发中,想进行word文档和pdf文档进行到txt文档的转换,可都遇到了问题,请大家帮忙。
在进行word-》txt转换时用的是已经在系统注册的word的一个com组件,可是每次转换都会生成一个word进程,可是在我们进行多线程大量转换时,有时候会出现word进程占有大量的cpu资源,怎么也释放不掉的现象,而且这个进程也不会自己杀掉。
在进行pdf-》txt转换时,用的时别人的组件,转换5。0和以下版本,没有问题,但是到了6。0版本的文档,这个中文就全成了乱码。(我装有中文的6.0)
请那位高手指教一下,哪里有组件,源代码也可以,语言c#最好,其他的也可以了。