lucene读取pdf文件出错!

cmc20090523 2009-05-23 09:07:23
INFO [main] (SimplePDFReader.java:32) - SQL21自学通.pdf
SQL21自学通.pdf
Exception in thread "main" java.lang.NoClassDefFoundError: org/fontbox/cmap/CMapParser
at org.pdfbox.pdmodel.font.PDFont.parseCmap(PDFont.java:534)
at org.pdfbox.pdmodel.font.PDFont.encode(PDFont.java:412)
at org.pdfbox.util.PDFStreamEngine.showString(PDFStreamEngine.java:325)
at org.pdfbox.util.operator.ShowText.process(ShowText.java:64)
at org.pdfbox.util.PDFStreamEngine.processOperator(PDFStreamEngine.java:452)
at org.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:215)
at org.pdfbox.util.PDFStreamEngine.processStream(PDFStreamEngine.java:174)
at org.pdfbox.util.PDFTextStripper.processPage(PDFTextStripper.java:336)
at org.pdfbox.util.PDFTextStripper.processPages(PDFTextStripper.java:259)
at org.pdfbox.util.PDFTextStripper.writeText(PDFTextStripper.java:216)
at org.pdfbox.util.PDFTextStripper.getText(PDFTextStripper.java:149)
at cn.sh.ideal.test.SimplePDFReader.getTextFromPDF(SimplePDFReader.java:39)
at cn.sh.ideal.test.SimplePDFReader.main(SimplePDFReader.java:19)
...全文
469 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
wybKerwin 2012-07-21
  • 打赏
  • 举报
回复
我靠, 楼主这种人, 把解决方法帖出来啊!!!
chen_3010 2012-07-06
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 的回复:]
搞定了,嘻嘻!
[/Quote]

你妹 。 你解决了也把答案发出来。 自私的家伙 。
billycca1 2009-05-25
  • 打赏
  • 举报
回复
把源代码发来看看,呵呵 ,刚刚在Lucene站点查找!!!
cmc20090523 2009-05-23
  • 打赏
  • 举报
回复
搞定了,嘻嘻!
cmc20090523 2009-05-23
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 oraclelogan 的回复:]
引用楼主 cmc20090523 的帖子:
INFO [main] (SimplePDFReader.java:32) - SQL21自学通.pdf
SQL21自学通.pdf
Exception in thread "main" java.lang.NoClassDefFoundError: org/fontbox/cmap/CMapParser
at org.pdfbox.pdmodel.font.PDFont.parseCmap(PDFont.java:534)
at org.pdfbox.pdmodel.font.PDFont.encode(PDFont.java:412)
at org.pdfbox.util.PDFStreamEngine.showString(PDFStreamEngine.java:325)
at org…
[/Quote]

嗯,是的,用的boxpdfjar包。
oraclelogan 2009-05-23
  • 打赏
  • 举报
回复
[Quote=引用楼主 cmc20090523 的帖子:]
INFO [main] (SimplePDFReader.java:32) - SQL21自学通.pdf
SQL21自学通.pdf
Exception in thread "main" java.lang.NoClassDefFoundError: org/fontbox/cmap/CMapParser
at org.pdfbox.pdmodel.font.PDFont.parseCmap(PDFont.java:534)
at org.pdfbox.pdmodel.font.PDFont.encode(PDFont.java:412)
at org.pdfbox.util.PDFStreamEngine.showString(PDFStreamEngine.java:325)
at org.pdfbox.util.operator.ShowText…
[/Quote]

对了,你用的什么jar包读取pdf文件呢,是用的poxpdf jar包吗?
oraclelogan 2009-05-23
  • 打赏
  • 举报
回复
java.lang.NoClassDefFoundError: org/fontbox/cmap/CMapParser

很明显了少了一个jar包,从了、org/fontbox/cmap/CMapParser来看,jar包名字可能带fontbox的名字,你在百度上检索下 fontbox .jar试试能不能找到这个jar包呢?
cmc20090523 2009-05-23
  • 打赏
  • 举报
回复
这个问题如何解决?

2,760

社区成员

发帖
与我相关
我的任务
社区描述
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
社区管理员
  • 搜索引擎技术社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧