我现在正在全文检索,现在对txt,HTML,WORD都能生成检索,对PDF的处理我才用了 PDFBOX0.7.3.1来做的,当它对中文不支持,现在我只能对完全是英文的PDF出来,生成检索,不知道谁能说怎么对中文的PDF文档进行处理,获取到它的中文内容。
我现在正在全文检索,现在对txt,HTML,WORD都能生成检索,对PDF的处理我采用了 PDFBOX0.7.3.1来做的,但它对中文不支持,现在我只能对完全是英文的PDF获取内容,生成检索,不知道谁能说怎么对中文的PDF文档进行处理,获取到它的中文内容。只要获取能容就可以了,中文内容,其他的我自己能解决。
要求:1.通过JAVA程序来实现获取中文PDF的内容。2.速度要快些。3.说明要详细。4.谁给了完整的方案,我给它150分。参与的看情况给100到200之间。5.我有足够的分给大家,大家放心。不过copy他人方案的也给分。给0分,呵呵。笑话,请大家积极参与。