请教一个Python爬虫问题

zaixiankaifa 2017-03-22 12:13:50

一个用Python写的简单爬虫程序:

import urllib2
url = "http://www.126.com"

request = urllib2.Request(url)
request.add_header("user-agent","safari/10.0.3")
response = urllib2.urlopen(request)

print len(response.read())
print response.getcode()
print response.read()
运行结果:
97571
200
运行的时候最后一行代码 :print response.read() 不运行, 不知道为啥. 但是把print len(response.read())这一行注释之后, 最后一行代码就正常可以运行了, 这是什么呢?

...全文

190 4 打赏收藏转发到动态举报

写回复

4 条回复

切换为时间正序

请发表友善的回复…

发表回复

sanGuo_uu 2017-03-22

打赏
举报

回复

引用

print response.read() 不运行

你怎么知道它没运行？说不定它就是空的呢。（也行你会说，它明明就不是空的啊） html=response.read() 把它存下来，再调用。就好了。

zaixiankaifa 2017-03-22

打赏
举报

回复

引用 2 楼 sinat_28984567 的回复:

response.read() 这句是不是代表着已经把内容读完了，不能读取第二次。 PS： [quote=引用 1 楼 yupeigu 的回复:] 你试试把数据存到文件里呢，会不会数据太多了

在这还碰见了版主了

[/quote] 好像是跟seek()有关系的, read()之后指针偏移值就不再是0了,所以读取不到

二月十六 2017-03-22

打赏
举报

回复

response.read() 这句是不是代表着已经把内容读完了，不能读取第二次。 PS：

引用 1 楼 yupeigu 的回复:

你试试把数据存到文件里呢，会不会数据太多了

在这还碰见了版主了

LongRui888 2017-03-22

打赏
举报

回复

你试试把数据存到文件里呢，会不会数据太多了

锅炉系统完整工程设计方案（深度详细版）.docx

资料来源：湖南优象科技有限公司资料链接下载。里面包含了：湖南优象科技有限公司光流飞控端的使用源码(参考代码)demo，湖南优象科技有限公司上位机光流软件，配置文件，LC307需初始化设置的光流模块配置选项说明图，飞控端调试光流方法说明V1.0@20240329，光流模块使用手册(LC-307)V1.3@20230223，无人机光流模块使用技巧。原来的下载链接通过百度网盘分享的文件：光流模块使用手册… 链接:https://pan.baidu.com/s/1ktmurBJHyzPNgBS298_wyw?pwd=sdgl 家人们谁懂哇，csdn和优象官网，只找到了使用手册，配置文件一点都不带有的哇，去找淘宝客服直接说没有。去找优象科技有限公司的邮箱才给我发哇。。。。。。。

下载代码方式：https://pan.quark.cn/s/a4b39357ea24 SHEMaskDemo App遮罩引导操作提示使用说明类的操作引导提示，点击x或“我知道了”或“下一步”直到结束。 Image text

机电一体化系统综合课程设计_X-Y数控工作台设计说明书——22.rar

无尽冬日AAAAAAAAAAB

87,991

社区成员

224,684

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章