社区
脚本语言
帖子详情
BeautifulSoup抓取标签外的数据。。
weixin_43828179
2019-04-22 02:08:04
求问各位大佬,BeautifulSoup 如何抓取标签外的数据呢,正则先不算。
网页代码是图中这样的
需要抓取的值都是放在span标签之外的的,抓取span标签并不能获取实际需要的值。
有什么方法变通的方法可以抓到这里的值呢,求各位大佬指点。。谢谢!
正则是一种方法,还有其他的方法吗
...全文
348
2
打赏
收藏
BeautifulSoup抓取标签外的数据。。
求问各位大佬,BeautifulSoup 如何抓取标签外的数据呢,正则先不算。 网页代码是图中这样的 需要抓取的值都是放在span标签之外的的,抓取span标签并不能获取实际需要的值。 有什么方法变通的方法可以抓到这里的值呢,求各位大佬指点。。谢谢! 正则是一种方法,还有其他的方法吗
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
2 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
OREO137257538
2021-06-10
打赏
举报
回复
请问解决了嘛 我也有这个问题
陈年椰子
2019-04-23
打赏
举报
回复
可以用字符串处理, 从把 <span .. > 替换成 # </span> 替换成 | 出来的数据就比较整齐了, 按 # 和 | split 可以直接变成 二维列表。
python3
BeautifulSoup
模块使用字典的方法
抓取
a
标签
内的
数据
示例
主要介绍了python3
BeautifulSoup
模块使用字典的方法
抓取
a
标签
内的
数据
,结合实例形式Fenix了python3
BeautifulSoup
模块进行
数据
的
抓取
相关操作技巧,需要的朋友可以参考下
使用python进行网络
抓取
:在此存储库中,我将说明如何使用带有
BeautifulSoup
的python编程语言来
抓取
网站并请求模版
您将从这篇文章中学到什么: 对网页
抓取
的基本了解如何使用类和HTML
标签
从网站提取
数据
如何使用请求模块获取
数据
如何使用
Beautifulsoup
要求: python3 要求bs4 安装: 须藤apt-get python3-pip pip3安装请求pip3...
Coursera_courses_scraper:Scraper 使用 Selenium 模拟浏览器并
抓取
异步网站
抓取
的课程
数据
使用 Beautiful Soup 进行解析,并将每个课程保存到 Postgres
数据
库中。 技术栈 Python、
BeautifulSoup
、Selenium、SQLAlchemy、PostgreSQL、Unittest 显着特点 使用正则表达式从 html
标签
中提取...
用Python程序
抓取
网页的HTML信息的一个小实例
抓取
网页
数据
的思路有好多种,一般有:直接代码请求http、模拟浏览器请求
数据
(通常需要登录验证)、控制浏览器实现
数据
抓取
等。这篇不考虑复杂情况,放一个读取简单网页
数据
的小例子: 目标
数据
将ittf网站上这个...
互联网程序员都每天刷题嘛-LearnScrapy:学习Scrapy
网站上显示的
数据
是不是从其他网站上
抓取
后攒出来的? 2.2 再端一碗
BeautifulSoup
CSS 的发明却是网络爬虫的福音 2.2.1
BeautifulSoup
的find()和findAll() 2.2.2 其他
BeautifulSoup
对象
BeautifulSoup
对象
标签
...
脚本语言
37,722
社区成员
34,238
社区内容
发帖
与我相关
我的任务
脚本语言
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
复制链接
扫一扫
分享
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
试试用AI创作助手写篇文章吧
+ 用AI写文章