关于python爬虫爬取图片文件命名的问题

XComedian 2017-08-29 08:07:03

#加载包
import requests
from bs4 import BeautifulSoup
import re
import os

url='http://532movie.bnu.edu.cn/list/1.html'
res=requests.get(url)
res.encoding='gzip'
soup=BeautifulSoup(res.text,'html.parser')
#获取电影名称
name=[]
for i in range(len(soup.select('.span2'))):
name.append(re.sub('\n|\s','',soup.select('.span2')[i].text))
#获取图片网址
Img=[]
for j in range(len(soup.select('img'))):
Img.append('http://532movie.bnu.edu.cn/'+soup.select('img')[j]['data-src'])
#存取图片到本地
for i in range(len(Img)):
response=requests.get(Img[i],stream=True)
path=os.path.join('G:/FILES/Python/532/',name[i]+'.jpg')
with open(path,'wb') as fw:
fw.write(response.content)

name的输出结果如下
['诺丁山/摘星奇缘(港)/No', '沃伦/Hatred/Wołyń', '悟空传/Wukong', '绿里奇迹/绿色奇迹(台)/', '蝙蝠侠前传1:侠影之谜/B', '蝙蝠侠前传2:黑暗骑士/T', '蝙蝠侠前传3:黑暗骑士崛', '生死之墙/危墙狙击(台)/', '逆时营救/致命倒数', '目击者之追凶/WhoKill', '绝世高手之料理铁人/绝世', '明天也有好吃的饭/明天也', '冈仁波齐/Pathsofth', '银河护卫队2/星际异攻队2', '征服者佩尔/征服者佩利/P', '普罗米修斯/异形前传/Pr', '奇迹,那天如此重要/唱吧', '29+1', '生吃/舐血成人礼(港)/Gr', '异形:契约/异形:圣约(港', '52赫兹,我爱你/52Hz我爱', '新木乃伊/盗墓迷城(港)/', '最好的时光/ThreeTim', '亚瑟王:斗兽争霸/亚瑟王', '记忆战/记忆大师', '战狼/特种兵之战狼', '隐藏人物/NASA无名英雌(', '悲情城市/ACityofS', '攻壳机动队/攻壳机动队真', '伤痕累累的恶魔/Kizuda']

我想的是利用电影的名称来命名图片,但是这样显示没有相应的路径。
错误代码如下:
[Errno 2] No such file or directory: 'G:/FILES/Python/532/诺丁山/摘星奇缘(港)/No.jpg'
求解大神们该怎么解决?
...全文
933 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

61,114

社区成员

发帖
与我相关
我的任务
社区描述
层叠样式表(英文全称:Cascading Style Sheets)是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言。
社区管理员
  • HTML(CSS)社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧