Python程序设计作业20：crawler

2019300993-艾碧纯 2022夏-程序设计实训 2022-07-29 20:47:16

from requests_html import HTMLSession


def crawler(books=[]):
    session = HTMLSession()
    url = 'https://www.qidian.com/rank/yuepiao/'
    r = session.get(url)

    names = {}
    j = 1
    for i in range(1, 21):
        xp = f'/html/body/div[1]/div[6]/div[2]/div[2]/div/div/ul/li[{i}]/div[2]/h2/a/text()'
        name = r.html.xpath(xp)

        if name[0] in books:
            names[name[0]] = j
            j += 1

    return names


print(crawler(['光阴之外', '夜的命名术', '明克街13号']))

...全文

251 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

爬虫（Web Crawler）是一种自动化程序，用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储，以便后续分析或展示。爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。爬虫的...

爬虫（Web Crawler）是一种自动化程序，用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储，以便后续分析或展示。爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。爬虫的...

借助 Python 和 Scrapy 语言框架基础，以“旅游网站”为爬取目标，通过分析当前现有Web crawler 的运行机理、功能单元以及算法程序，试探性的创建一个针对性比较强的网络爬虫，对课题的目标数据进行爬取。...

爬虫（Web Crawler）是一种自动化程序，用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储，以便后续分析或展示。爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。爬虫的...

程序采用 python 开发的 Scrapy 框架来开发，使用 Xpath 技术对下载的网页进行提取解析，运用 Redis 数据库做分布式，设计并实现了针对当当图书网的分布式爬虫程序，scrapy-redis是一个基于redis的scrapy组件，...

西工大网安实践教学社区

34

社区成员

195

社区内容

发帖

与我相关

我的任务

python安全linux 高校

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章