python爬取小说
# 爬虫下载一本小说
import time
import requests
import os
from bs4 import BeautifulSoup # 从bs4库中导入BeautifulSoup
import random # 导入随机数模块,用于随机生成休眠时间,防止被封IP(这个方法很慢),还可以用代理IP
# headers随便找一个浏览器的请求头就行
headers = {
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/112.0.0.0 Safari/537.36 Edg/112.0.1722.68"
} # 这里放你自己的user-agent,不懂的可以参考上篇文章
fileName = "我在精神病院学斩神"
if not os.path.exists(fileName): # 判断文件夹是否存在
os.mkdir(fileName) # 创建文件
, 相关下载链接:
https://download.csdn.net/download/u014481728/88495167?utm_source=bbsseo