missing 1 required positional argument :parser

qq_28615467 2017-10-08 10:56:44

按照python数据处理这本书的介绍利用slate.py正在对pdf文件内容进行解析，现在当运行cmd时会出现这个错误。
missing 1 required positional argument :parser

import sys

PYTHON_3 = sys.version_info[0] == 3

if PYTHON_3:

    from io import StringIO

else:

    from StringIO import StringIO

    from pdfminer.pdfpage import PDFPage





from pdfminer.pdfparser import PDFParser

from pdfminer.pdfinterp import PDFResourceManager

from pdfminer.pdfinterp import PDFPageInterpreter as PI

from pdfminer.layout import LAParams

from pdfminer.converter import TextConverter

# the internal API has changed between versions upstream,

# allow both here..

try:

    from pdfminer.pdfparser import PDFDocument

except ImportError:

    from pdfminer.pdfdocument import PDFDocument

try:

    from pdfminer.pdfparser import PDFPage

except ImportError:

    from pdfminer.pdfpage import PDFPage

import utils



__all__ = ['PDF']



class PDFPageInterpreter(PI):

    def process_page(self, page):

        if hasattr(self, 'debug'):

            if 1 <= self.debug:

                print >>stderr, 'Processing page: %r' % page

        (x0,y0,x1,y1) = page.mediabox

        if page.rotate == 90:

            ctm = (0,-1,1,0, -y0,x1)

        elif page.rotate == 180:

            ctm = (-1,0,0,-1, x1,y1)

        elif page.rotate == 270:

            ctm = (0,1,-1,0, y1,-x0)

        else:

            ctm = (1,0,0,1, -x0,-y0)

        self.device.outfp.seek(0)

        self.device.outfp.truncate(0)

        self.device.begin_page(page, ctm)

        self.render_contents(page.resources, page.contents, ctm=ctm)

        self.device.end_page(page)

        return self.device.outfp.getvalue()



class PDF(list):

    def __init__(self, file, password='', just_text=1, check_extractable=True, char_margin=1.0, line_margin=0.1, word_margin=0.1):

        self.parser = PDFParser(file)

        self.laparams = LAParams(char_margin=char_margin, line_margin=line_margin, word_margin=word_margin)



        if PYTHON_3:

            self.doc = PDFDocument()

            self.parser.set_document(self.doc)

            self.doc.set_parser(self.parser)

            self.doc.initialize(password)

        else:

            self.doc = PDFDocument(self.parser, password)



        if not check_extractable or self.doc.is_extractable:

            self.resmgr = PDFResourceManager()

            self.device = TextConverter(self.resmgr, outfp=StringIO(), laparams=self.laparams)

            self.interpreter = PDFPageInterpreter(

               self.resmgr, self.device)



            if PYTHON_3:

                page_generator = self.doc.get_pages()

            else:

                page_generator = PDFPage.create_pages(self.doc)



            for page in page_generator:

                self.append(self.interpreter.process_page(page))

            self.metadata = self.doc.info

        if just_text:

            self._cleanup()



    def _cleanup(self):

        """

        Frees lots of non-textual information, such as the fonts

        and images and the objects that were needed to parse the

        PDF.

        """

        self.device = None

        self.doc = None

        self.parser = None

        self.resmgr = None

        self.interpreter = None



    def text(self, clean=True):

        """

        Returns the text of the PDF as a single string.

        Options:



          :clean:

            Removes misc cruft, like lots of whitespace.

        """

        if clean:

            return utils.normalise_whitespace(''.join(self).replace('\n', ' '))

        else:

            return ''.join(self)

import slate



pdf = 'EN-FINAL Table 9.pdf'



with open(pdf) as f:

    doc = slate.PDF(f)



for page in doc[:2]:

    print (type(page))

...全文

1412 回复打赏收藏转发到动态举报

写回复

用AI写文章

切换为时间正序

请发表友善的回复…

发表回复

1、在做python+appium自动化测试时，使用装饰器@pytest.mark.parametrize（“参数”，[值1，值2，值3]），测试脚本执行返回test_xx() missing 1 required positional argument:“参数”2、检查老半天以为自己调用装饰器语法错误，结果是因为这个装饰器是pytest的，而我当前测试脚本所在类继承了unittest，执行的时候用的是unittest框架，所以直接报错。2、测试脚本要符合pytest的格式，最后执行成功了。

在Python编程中，遇到“TypeError: init() missing 1 required positional argument: ‘scheme’”这样的错误通常表明在实例化一个类时，没有提供类构造函数__init__方法所需的所有位置参数。具体来说，这个错误提示我们在创建一个类的实例时，遗漏了一个名为‘scheme’的必需参数。在上述代码中，URLParser类的构造函数需要一个scheme参数，但在创建parser实例时没有提供，因此Python解释器会抛出一个TypeError。

TypeError: parse() missing 1 required positional argument: 'response'

一、报错如下： File "C:\Users\asus\Desktop\Others\ABC\CCC\utils\parser.py", line 23, in merge_from_file self.update(yaml.load(fo.read())) TypeError: load() missing 1 required positional argument: 'Loader' 二、原因分析：由于Yaml 5.1版本后弃用了 yaml.load(file) 这个用法。Yaml 5.

先实例化，后调用。不能直接import进来

脚本语言

37,743

社区成员

34,212

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章