BeautifulSoup解析url

szto2003 2020-10-03 07:46:20

如何使用BeautifulSoup取出window.open里的url（https://bbs.csdn.net/topics/392161042?list=lz），王高手指点

<script>window.open("https://bbs.csdn.net/topics/392161042?list=lz", "_self");</script>

...全文

263 5 打赏收藏转发到动态举报

写回复

用AI写文章

5 条回复

切换为时间正序

请发表友善的回复…

发表回复

szto2003 2020-10-06

打赏
举报

使用正则表达式搞定，多谢各位了！

tianfang 2020-10-04

打赏
举报

bs找<script>，然后在其中找window.open

szto2003 2020-10-04

打赏
举报

自己再顶一下

szto2003 2020-10-03

打赏
举报

不是要执行js，是解析这个带script的字符串，把windows.open里的url地址字符串取出来就可以了！

tianfang 2020-10-03

打赏
举报

这个不是BeautifulSoup可以做的，需要selenium加载并执行js代码，生成有效的html。然后BeautifulSoup才能分析html

摘要如何用beautifulsoup4解析各种情况的网页 beautifulsoup4的使用关于beautifulsoup4，官网已经讲的很详细了，我这里就把一些常用的解析方法做个总结，方便查阅。装载html文档使用beautifulsoup的第一步是把html文档装载到beautifulsoup中，使其形成一个beautifulsoup对象。 import requests from bs4 import BeautifulSoup url = "http://new.qq.com/omn/20180705/20180705A0920X.html" r = requests.g

本文实例主要实现的是使用urllib和BeautifulSoup爬取维基百科的词条，具体如下。简洁代码： #引入开发包 from urllib.request import urlopen from bs4 import BeautifulSoup import re #请求URL并把结果用UTF-8编码 resp=urlopen(https://zh.wikipedia.org/wiki/Wikipedia:首页).read().decode(utf-8) #使用BeautifulSoup去解析 soup=BeautifulSoup(resp,h

常见的beautifulsoup用法 find() find_all() select() 可以传送的参数和在其中使用的方法：标签，正则表达式，属性 from typing import Container from bs4 import BeautifulSoup import re html_str = ''' <div> <ul> <li class="item-1" id='link11'><a href="link1

爬虫利器BeautifulSoup爬取一个页面的所有URL，可以简单分为三个步骤：使用requests获取页面内容使用BeautifulSoup进行页面内容解析提取并整理所需要的URL 代码实例 # 导入BeautifulSoup和requests模块 from bs4 import BeautifulSoup import requests # 获取字符串格式的html_d...

BeautifulSoup 和 lxml 一样，BeautifulSoup 也是一个 HTML/XML 的解析器，主要的功能也是解析和提取 HTML/XML 数据。根据提示，在右侧编辑器 Begin-End 区间补充代码，完善函数 get_data()，使用 bs4 解析爬取古诗词网古诗的内容部分，并将内容以列表形式返回。为爬取网页的效果代码，可以使用开发者工具审查元素，查看古诗的内容部分位于哪个标签。，安装 BeautifulSoup 模块，如下图所示。平台会对你编写的代码进行测试，当。

脚本语言

37,743

社区成员

34,211

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章