[求助]一个关于urllib2的基本问题

tmy13 2012-11-22 02:40:11
新学的python很多东西都不理解。网上看了段爬虫的代码,于是就想试试了。
使用
urllib2.urlopen('http://dmm.hk/js/small/baidu.gif')
获取图片没有问题,但是当我试图想获取下面的图片时
urllib2.urlopen('http://113.107.42.72:88/images/uploadimg/rw201209231637.jpg')
却出现了问题,返回的异常貌似是404 not found,但我用浏览器开打是正常的,确实存在这么一个图片。
实在想不出可能产生的原因,特来求助。
...全文
114 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
tmy13 2012-11-26
  • 打赏
  • 举报
回复
引用 1 楼 crifan 的回复:
1.你的图片地址,有可能是有时效性的。 所以,需要: (1)了解本身的逻辑 可参考: 【整理】关于抓取网页,分析网页内容,模拟登陆网站的逻辑/流程和注意事项 2.用工具抓取出你自己此处的逻辑 可参考: 【教程】手把手教你如何利用工具(IE9的F12)去分析模拟登陆网站(百度首页)的内部逻辑过程 3.然后分析找到对应的图片地址,再写代码下载 可参考……
谢谢你的回答,确实是因为设置的防盗链
crifan 2012-11-23
  • 打赏
  • 举报
回复
1.你的图片地址,有可能是有时效性的。 所以,需要: (1)了解本身的逻辑 可参考: 【整理】关于抓取网页,分析网页内容,模拟登陆网站的逻辑/流程和注意事项 2.用工具抓取出你自己此处的逻辑 可参考: 【教程】手把手教你如何利用工具(IE9的F12)去分析模拟登陆网站(百度首页)的内部逻辑过程 3.然后分析找到对应的图片地址,再写代码下载 可参考: 【教程】抓取网并提取网页中所需要的信息 之 Python版【教程】模拟登陆网站 之 Python版(内含两种版本的完整的可运行的代码) 4.还是不能下载的话,也可能是人家网站做了防盗链 其中一种,可能的办法是,传递对应的referer 相关函数实现,可以参考: crifanLib.py中的manuallyDownloadFile()函数

37,719

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧