BeautifulSoup抓取标签外的数据。。

weixin_43828179 2019-04-22 02:08:04

求问各位大佬，BeautifulSoup 如何抓取标签外的数据呢，正则先不算。

网页代码是图中这样的

需要抓取的值都是放在span标签之外的的，抓取span标签并不能获取实际需要的值。

有什么方法变通的方法可以抓到这里的值呢，求各位大佬指点。。谢谢！

正则是一种方法，还有其他的方法吗

...全文

348 2 打赏收藏转发到动态举报

写回复

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

OREO137257538 2021-06-10

打赏
举报

回复

请问解决了嘛我也有这个问题

陈年椰子 2019-04-23

打赏
举报

回复

可以用字符串处理，从把 <span .. > 替换成 # </span> 替换成 | 出来的数据就比较整齐了，按 # 和 | split 可以直接变成二维列表。

主要介绍了python3 BeautifulSoup模块使用字典的方法抓取a标签内的数据,结合实例形式Fenix了python3 BeautifulSoup模块进行数据的抓取相关操作技巧,需要的朋友可以参考下

您将从这篇文章中学到什么：对网页抓取的基本了解如何使用类和HTML标签从网站提取数据如何使用请求模块获取数据如何使用Beautifulsoup 要求： python3 要求bs4 安装：须藤apt-get python3-pip pip3安装请求pip3...

抓取的课程数据使用 Beautiful Soup 进行解析，并将每个课程保存到 Postgres 数据库中。技术栈 Python、BeautifulSoup、Selenium、SQLAlchemy、PostgreSQL、Unittest 显着特点使用正则表达式从 html 标签中提取...

抓取网页数据的思路有好多种，一般有：直接代码请求http、模拟浏览器请求数据（通常需要登录验证）、控制浏览器实现数据抓取等。这篇不考虑复杂情况，放一个读取简单网页数据的小例子：目标数据将ittf网站上这个...

网站上显示的数据是不是从其他网站上抓取后攒出来的？ 2.2　再端一碗BeautifulSoup CSS 的发明却是网络爬虫的福音 2.2.1　BeautifulSoup的find()和findAll() 2.2.2　其他BeautifulSoup对象 BeautifulSoup 对象标签...

37,722

社区成员

34,238

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章