求python中抓取网页时有跳转页面时的新页面地址

yybjroam05 2011-10-08 04:39:42
我用python抓取一个网页(a.asp)时可以成功,但这个页面直接跳转到新的页面(b.asp)了。
所以实际上我得到的是b.asp的内容.(b.asp这个页面地址我不知道)
现在我想通过程序来获取取到b.asp这个页面地址
import urllib2
content = urllib2.urlopen('http://192.168.0.2:9191/test.asp')
print content

...全文
1373 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
iambic 2011-10-09
  • 打赏
  • 举报
回复
贴下你实际拿到的内容。
如果是302的话,应该会自动去拿新的跳转地址。如果是返回的html里用javascript做的跳转,需要你自己解析处理。贴出来看下。
yybjroam05 2011-10-09
  • 打赏
  • 举报
回复
我昨天查了手册,发现是urllib2.geturl() 可以得到最终的页面地址
WaistCoat07 2011-10-08
  • 打赏
  • 举报
回复
import httplib

conn = httplib.HTTPConnection("192.168.0.2", 9191)
conn.request("GET", "/test.asp")
r = conn.getresponse()
if r.status == 302:
data = r.read()
print data
WaistCoat07 2011-10-08
  • 打赏
  • 举报
回复
直接用httplib.HTTPConnection,
通过request获取返回码是302重定向。
然后去内容就可以了

37,719

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧