python爬虫，筛选指定元素代码中['str']用法求解？

buzhihuowu7 2019-05-18 10:11:55

如下代码， img_src=img_url['src']，请问img_url['src']如何理解？爬虫小白，请大佬解惑。。。 import os import requests from bs4 import BeautifulSoup url='http://tieba.baidu.com/p/2166231880' html =requests.get(url) soup =BeautifulSoup(html.text,'html.parser') img_urls=soup.findAll('img',bdwater='杉本有美吧,1280,860') for img_url in img_urls: img_src=img_url['src'] #此处img_url用来遍历soup.findAll返回的列表，['src']是什么用法？ with open('download/'+os.path.split(img_src)[1],'wb') as f: f.write(requests.get(img_src).content)

...全文

241 4 打赏收藏转发到动态举报

写回复

用AI写文章

4 条回复

切换为时间正序

请发表友善的回复…

发表回复

buzhihuowu7 2019-05-21

打赏
举报

引用 1 楼一笑程序猴的回复:

首先上面soup查询的是所有的bdwater='杉本有美吧,1280,860'的img标签，其中src是img标签的一个属性，然后img_url['src']就是取img标签中属性src的值，也就是图片的url地址。

img_url['src']按照python语法来看应该是取字典img_url中键'src'的值，所以img_url应该是个字典咯，但代码中的img_url明显不是字典啊？

一笑程序猴 2019-05-21

打赏
举报

引用 3 楼 buzhihuowu7 的回复:

[quote=引用 1 楼一笑程序猴的回复:]首先上面soup查询的是所有的bdwater='杉本有美吧,1280,860'的img标签，其中src是img标签的一个属性，然后img_url['src']就是取img标签中属性src的值，也就是图片的url地址。

img_url['src']按照python语法来看应该是取字典img_url中键'src'的值，所以img_url应该是个字典咯，但代码中的img_url明显不是字典啊？[/quote]
这里的img_url并不是字典而是BeautifulSoup类型的img标签，因为用的是BeautifulSoup库解析的，所以img_urls里存放的应该是BeautifulSoup类型的img标签的集合，类似这样
['<img src="....." />','<img src="....." />']
所以遍历的时候用img_url['src']并不是说取字典中的键值，而是BeautifulSoup的一种语法，即取img标签的src属性值