下载了pdfparser怎么用啊?我想读取pdf文件文本内容

asyncyd 2017-11-21 05:31:01
下面的代码是搜到的教程
    
// 获取参数,文件所在路径
$path = $_GET['path'];
// 创建源码中的Parser类对象
$parser = new \Smalot\PdfParser\Parser();
// 调用解析方法,参数为pdf文件路径,返回结果为Document类对象
$document = $parser->parseFile($path);
// 获取所有的页
$pages = $document->getPages();
// 逐页提取文本
foreach($pages as $page){
echo($page->getText());
}

我是php新手,之前下载的类代码都是先引用类文件,如:require "phpExcel/Classes/PHPExcel.php";
可是pdfparser搜索的所有教程都没说怎么引用,然后下面这句出错:
$parser = new \Smalot\PdfParser\Parser();
运行后提示Fatal error: Class 'Smalot\PdfParser\Parser' not found。
下面是我下载的pdfparser目录:

谢谢各位!
...全文
672 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
qq_39177602 2018-08-03
  • 打赏
  • 举报
回复
我获取到了信息和全部内容,但是为什么获取韩文的时候会出现乱吗?
qq_39177602 2018-08-01
  • 打赏
  • 举报
回复
怎么获取页数啊?
asyncyd 2017-11-22
  • 打赏
  • 举报
回复
引用 1 楼 xuzuning 的回复:
示例代码: $document = \Smalot\PdfParser\Document::parseFile('document.pdf'); $pages = $document->getPages(); $text = $pages[1]->getText();
知道了,用哪个类就引用哪个文件,但是还是读不出来,又导入TCPDF中的pdf_parser类,调用tcpdf的时候出错,以下是PDF_PARSER类中的__construct函数: foreach ($this->xref['xref'] as $obj => $offset) { if (!isset($this->objects[$obj]) AND ($offset > 0)) { // decode objects with positive offset $this->objects[$obj] = $this->getIndirectObject($obj, $offset, true); //读到644行的时候上面这句出错 } }
伟洪winni 2017-11-22
  • 打赏
  • 举报
回复
pdfparser 还不错
xuzuning 2017-11-21
  • 打赏
  • 举报
回复
示例代码: $document = \Smalot\PdfParser\Document::parseFile('document.pdf'); $pages = $document->getPages(); $text = $pages[1]->getText();

21,886

社区成员

发帖
与我相关
我的任务
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
  • 基础编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧