pdf文件是否为扫描件怎么判断?

爱打篮球的程序员 2011-06-07 11:41:33
目前想到用pdfbox读取pdf文件,判断其字体信息是否存在为依据的。但有些不完整的pdf文档用pdfbox加载,load时抛异常:

2011-06-07 09:46:33 ERROR lang.Class - expected='endobj' firstReadAttempt='endobj10' secondReadAttempt='0' org.pdfbox.io.PushBackInputStream@2c6df87b
2011-06-07 09:46:49 ERROR lang.Class - Error: Expected an integer type, actual='endstream'

谁能提供个其它的判断方式啊?
...全文
1068 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
rain21616 2011-10-31
  • 打赏
  • 举报
回复
求解!

50,523

社区成员

发帖
与我相关
我的任务
社区描述
Java相关技术讨论
javaspring bootspring cloud 技术论坛(原bbs)
社区管理员
  • Java相关社区
  • 小虚竹
  • 谙忆
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧