【Python】使用bs4的

全栈小5
全栈领域优质创作者
博客专家认证
2023-02-24 13:10:14

1、安装两个插件

pip install bs4

img

2、简单读取和解析html

#!/usr/bin/python3
# -*- coding: utf-8 -*-
# 2023-02-23

import requests
from bs4 import BeautifulSoup

# 获取C占首页【热点】资讯
url = 'https://www.csdn.net/?spm=1001.2100.3001.4476'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36 Edg/110.0.1587.50'
}
 
response = requests.get(url, headers=headers)
html = response.text
 
# 解析HTML代码
soup = BeautifulSoup(html, 'html.parser')
 
# 找到标题区域
article_tags = soup.select('.headswiper-item')
    
# 提取每篇文章的标题和链接
results = []
for tag in article_tags:
    title_tags = tag.select('.headswiper-item > a')
    if title_tags:
        title = title_tags[0].get_text().strip()
        link = title_tags[0]['href']
        results.append((title, link))

for item in results:
    print(f'{list(item)[0]}、{list(item)[1]}')

img

...全文
58 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

443

社区成员

发帖
与我相关
我的任务
社区描述
欢迎加入【基础知识小馆】,本小馆主要展示和分享大家记录的基础知识!帮助别人,成长你我!C#、.net core、Python、Java,Sql Server、mysql、oracle、Go等
javac#c语言 个人社区 广东省·广州市
社区管理员
  • 全栈小5
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧