无法爬取淘宝商品的图片

夜445 2021-04-19 10:39:02
按照教程的编写,仍然无法将淘宝商品的图片下载下来,到底哪里出了问题?有没有人可以告诉我。

import urllib.request
import re
import random

keyname = "连衣裙"
key = urllib.request.quote(keyname)
uapools = ["Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 "
"(KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36",
"Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) "
"Chrome/86.0.4240.111 Safari/537.36",
"Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0)",
]

def ua(uapools):
thisua = random.choice(uapools)
print(thisua)
headers = ("User-Agent", thisua)
opener = urllib.request.build_opener()
opener.addheaders = [headers]
# 安装为全局
urllib.request.install_opener(opener)


for i in range(1, 10):
url = "https://s.taobao.com/search?q="+key+"&s="+str((i-1)*44)
ua(uapools)
date = urllib.request.urlopen(url).read().decode("utf-8", "ignore")
pat = '"pic_url":"//(.*?)"'
#本人测试到这里,pat 的长度值是有的,证明pat没有问题。
imglist = re.compile(pat).findall(date)
#本人测试到这里,imglist的长度是0。

for j in range(0, len(imglist)):
thisimg = imglist[j]
thisimgurl = "http://"+thisimg
localfile = "D:\\Program Files (x86)\\PyCharm Community Edition 2020.3.4\\date\\page\\" \
"taobao\\"+str(i)+str(j)+".jpg"
urllib.request.urlretrieve(thisimgurl, filename=localfile)
...全文
193 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
夜445 2021-04-23
  • 打赏
  • 举报
回复
整体思路我索然仍然不太明了,还有就是虽然我明白的你意思,但是看着你的代码,与我实现的有些不一样,你那个毕竟没有随机选择代理的,我那个是有的,随意我就不太明白你说的加cooik应该在我代码上加到哪里去?
  • 打赏
  • 举报
回复
引用 5 楼 夜445 的回复:
定义函数def ua(uapools)与for循环的ua(uapools)出现提示:Shadows name 'uapools' from outer scope,经搜索暂未能解决。
夜445 2021-04-23
  • 打赏
  • 举报
回复
定义函数def ua(uapools)与for循环的ua(uapools)出现提示:Shadows name 'uapools' from outer scope,经搜索暂未能解决。
  • 打赏
  • 举报
回复
想学习更多爬虫知识,欢迎来看看小编的波博客!
  • 打赏
  • 举报
回复
淘宝是需要登录才可以搜索的,如果没有登录,那个网址打开就会进入登录界面,所以请求头需要添加cooik字段,cookie字段在这里 ,另外,如果请求次数过多,还会出现滑动检验 代码参考如下 点开其中一个网址进入 就是需要爬取的网址了
夜445 2021-04-19
  • 打赏
  • 举报
回复
真的没大神??

37,719

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧