Scrapy怎么解决重定向问题及异步加载问题

如梦如我 2017-06-09 04:13:25
使用scarpy
爬取美团商家信息,模仿手机端浏览出现问题
一些网站会自动重定向变成网页浏览
例如这样:
DEBUG: Redirecting (303) to <GET http://i.meituan.com/gc/i/deal/37950574.html> from <GET http://i.meituan.com/deal/37950574.html> 例如这样
报错信息: 没有获取到值
File "C:\Users\Administrator\AppData\Local\Programs\Python\Python36\lib\site-packages\scrapy\item.py", line 59, in __getitem__
return self._values[key]
KeyError: 'Store_name'
尝试解决办法:
拒绝重定向,配置文件添加REDIRECT_ENABLED = False(失败) 凡是重定向网址,爬虫一概忽略
尝试解决办法2:
去重定向以后的页面,通过xpath获取元素(%90失败)
只有一小部分可以通过xpath获取到值,大半部分无法获取
原因:获取的网站不完整(考虑是异步加载的问题) 使用PostMan可以获取完整的网页数据


请问各位大神应该怎么做,异步加载我不会。。。 但我觉得就是异步加载的问题,获取不到完整的网页数据,xpath找不到想到的东西





...全文
692 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

37,719

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧