python爬虫,筛选指定元素代码中['str']用法求解?

buzhihuowu7 2019-05-18 10:11:55
如下代码, img_src=img_url['src'],请问img_url['src']如何理解? 爬虫小白,请大佬解惑。。。 import os import requests from bs4 import BeautifulSoup url='http://tieba.baidu.com/p/2166231880' html =requests.get(url) soup =BeautifulSoup(html.text,'html.parser') img_urls=soup.findAll('img',bdwater='杉本有美吧,1280,860') for img_url in img_urls: img_src=img_url['src'] #此处img_url用来遍历soup.findAll返回的列表,['src']是什么用法? with open('download/'+os.path.split(img_src)[1],'wb') as f: f.write(requests.get(img_src).content)
...全文
241 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
buzhihuowu7 2019-05-21
  • 打赏
  • 举报
回复
引用 1 楼 一笑程序猴的回复:
首先上面soup查询的是所有的bdwater='杉本有美吧,1280,860'的img标签,其中src是img标签的一个属性,然后img_url['src']就是取img标签中属性src的值,也就是图片的url地址。
img_url['src']按照python语法来看应该是取字典img_url中键'src'的值,所以img_url应该是个字典咯,但代码中的img_url明显不是字典啊?
一笑程序猴 2019-05-21
  • 打赏
  • 举报
回复
引用 3 楼 buzhihuowu7 的回复:
[quote=引用 1 楼 一笑程序猴的回复:]首先上面soup查询的是所有的bdwater='杉本有美吧,1280,860'的img标签,其中src是img标签的一个属性,然后img_url['src']就是取img标签中属性src的值,也就是图片的url地址。

img_url['src']按照python语法来看应该是取字典img_url中键'src'的值,所以img_url应该是个字典咯,但代码中的img_url明显不是字典啊?[/quote]
这里的img_url并不是字典而是BeautifulSoup类型的img标签,因为用的是BeautifulSoup库解析的,所以img_urls里存放的应该是BeautifulSoup类型的img标签的集合,类似这样
['<img src="....." />','<img src="....." />']
所以遍历的时候用img_url['src']并不是说取字典中的键值,而是BeautifulSoup的一种语法,即取img标签的src属性值
Steven·简谈 2019-05-20
  • 打赏
  • 举报
回复
img 中的属性提取吧 有时候如果代码可以成功运行,你可以看看结果怎么样,再反过来推断 就不用自己空想了
一笑程序猴 2019-05-20
  • 打赏
  • 举报
回复
首先上面soup查询的是所有的bdwater='杉本有美吧,1280,860'的img标签,其中src是img标签的一个属性,然后img_url['src']就是取img标签中属性src的值,也就是图片的url地址。

37,721

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧