[求助]一个关于urllib2的基本问题

tmy13 2012-11-22 02:40:11

新学的python很多东西都不理解。网上看了段爬虫的代码，于是就想试试了。
使用
urllib2.urlopen（'http://dmm.hk/js/small/baidu.gif')
获取图片没有问题，但是当我试图想获取下面的图片时
urllib2.urlopen('http://113.107.42.72:88/images/uploadimg/rw201209231637.jpg')
却出现了问题，返回的异常貌似是404 not found，但我用浏览器开打是正常的，确实存在这么一个图片。
实在想不出可能产生的原因，特来求助。

...全文

114 2 打赏收藏转发到动态举报

写回复

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

tmy13 2012-11-26

打赏
举报

回复

引用 1 楼 crifan 的回复:

1.你的图片地址，有可能是有时效性的。所以，需要：（1）了解本身的逻辑可参考：【整理】关于抓取网页，分析网页内容，模拟登陆网站的逻辑/流程和注意事项 2.用工具抓取出你自己此处的逻辑可参考：【教程】手把手教你如何利用工具(IE9的F12)去分析模拟登陆网站(百度首页)的内部逻辑过程 3.然后分析找到对应的图片地址，再写代码下载可参考……

谢谢你的回答，确实是因为设置的防盗链

crifan 2012-11-23

打赏
举报

回复

1.你的图片地址，有可能是有时效性的。所以，需要：（1）了解本身的逻辑可参考：【整理】关于抓取网页，分析网页内容，模拟登陆网站的逻辑/流程和注意事项 2.用工具抓取出你自己此处的逻辑可参考：【教程】手把手教你如何利用工具(IE9的F12)去分析模拟登陆网站(百度首页)的内部逻辑过程 3.然后分析找到对应的图片地址，再写代码下载可参考：【教程】抓取网并提取网页中所需要的信息之 Python版和【教程】模拟登陆网站之 Python版（内含两种版本的完整的可运行的代码） 4.还是不能下载的话，也可能是人家网站做了防盗链其中一种，可能的办法是，传递对应的referer 相关函数实现，可以参考： crifanLib.py中的manuallyDownloadFile()函数

转原地址： http://www.zhxl.me/1409.html 这里记录的是一个门外汉解决使用 urllib2 抓取网页时遇到乱码、崩溃、求助、解决和涨经验的过程。这类问题，事后看来只是个极小极小的坑，不过竟然花去很多时间，也值得记录一下。过程如下：目标：抓取 http://sports.sina.com.cn/g/premierleague/i

request 还是requests？来自Python小白真诚的求助！没办法，只能求助Google了！原来，Requests模块是一个用于网络访问的模块，网络访问就是利用某些参数发送请求，然后获取我们想要的信息。其实类似的模块有很多，比如urllib，urllib2，httplib，httplib2，他们基本都提供相似的网络访问功能。初学Python，虽然语法不算难，挺好学的，但是第三方模块...

有些第三方库，使用最新的版本会出现各种问题，对手经验不足的人来说很不友好，容易掉进坑里出不来，我是求助后，才解决的问题的。安装urllib3时，第一次选择的urllib3_的版本（安装失败），就报错了，提示找不到urllib3安装文件。2.删除系统的环境变量中，用户变量和系统变量的path变量中的相关python的两个路径删除掉。为了保证环境干净，我是把原来的python重新卸载，完全清理后，又进行安装的python的。当然，在过程中出现了selenium版本的问题，又需要重新卸载python的。

参考： http://www.zhxl.me/1409.html 使用 python urllib2 抓取网页时出现乱码的解决方案发表回复这里记录的是一个门外汉解决使用 urllib2 抓取网页时遇到乱码、崩溃、求助、解决和涨经验的过程。这类问题，事后看来只是个极小极小的坑，不过竟然花去很多时间，也值得记录一下。过程如下：目标：抓取 http://sports...

啃面包是辛苦的，那就开始学习爬虫吧，而学习爬虫的初衷很简单，爬图爬图，这就是学习的动力~ 1.爬虫信息了解 1）爬虫的定义：先了解，什么叫爬虫，上度娘搜了一番，解释如下：网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。复制代码而互联网就犹如一张蜘蛛网，而爬虫可以模拟浏览器的行为，做想做的事情，...

37,719

社区成员

34,238

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章