爬取知网摘要发生错误

wyx9822 2021-06-11 10:05:43

下面是用python爬取知网摘要的部分代码，试运行后发生“AttributeError: 'NoneType' object has no attribute 'span' ”错误，请问各位大佬这该怎么解决呀？

        html2 = driver.page_source
        soup = BeautifulSoup(html2, 'html.parser')
        text = soup.text
        text2 = text[re.search('摘要：', text).span()[1]:re.search('手机阅读本文', text).span()[0]]
        if '分类号：' in text2:
            tmp = text2[:re.search('分类号：', text2).span()[0]]
            keywords = tmp[re.search('关键词：', tmp).span()[1]:].strip().replace('\n',' ').replace(' ','')
        else:
            keywords = ''
        driver.close()
        driver.switch_to.window(driver.window_handles[1])
        driver.switch_to.frame(driver.find_element_by_id('iframeResult')) 
        dictionary = {
                "No.":No,
                "Title":title,
                "Abstract":ab,
                "Keywords":keywords,
                "Organizations":organizations,
                "Authors":authors,
                "Source":source,
                "Time":times,
                # "database":database,
                "Counted":counted,
                "DownloadCount":downloadCount,
                }
        print('这是第',page_mark,'页第',No,'条记录，标题为：',title)
        store_data(dictionary)
        time.sleep(random.uniform(5,8))

...全文

888 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

兰振lanzhen 2021-06-17

打赏
举报

回复

1、爬虫遇到这个，如果是可以获取部分内容，那说明有些页面是空得，re.search 返回得是空值，可以使用try except来过滤；

2、如果是完全都获取不到，那检查下这个re.search是否坑匹配到信息。

python爬虫爬取知网话不多说，直接上代码！ import requests import re import time import xlrd from xlrd import open_workbook from xlutils.copy import copy class BeautifulPicture(): def get_pic(self):...

python爬虫——使用selenium爬取知网文献相关信息写在前面：本文章限于交流讨论，请不要使用文章的代码去攻击别人的服务器如侵权联系作者删除文中的错误已经修改过来了，谢谢各位爬友指出错误在你复制本文章代码去...

用Python爬取指望关于某个主题的所有论文摘要等信息。...爬取知网统计数据，并下载文献然后学了一些关于正则匹配的（入门篇和中级篇）正则匹配入门篇我感觉把正则匹配学一些，然后稍微能看得懂一点的网页源码...

python爬取知网的数据进行各计算机领域学术关注度指数的可视化最近在思考人生，逛知网时发现知网会对每个科研关键词进行统计，给出一个关注度曲线。于是我就查看一些关键词的研究发展情况，但是每一次都要自己更换...

知网关键词搜索爬取摘要信息由于技术不成熟，代码冗余度较高。同时代码也可能会存在错误，也请各路高人指正。本篇文章应用范围为期刊搜索（不包括外文文献），其他内容，没有进行测试！！！本次爬虫所采用到的...

37,719

社区成员

34,238

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章