Python微博爬虫418错误,请教大佬

pandasgb 2019-04-05 10:02:08
最近在尝试抓微博的数据,但发现用selenium、requests请求都会在一段时间后出现状态码为418的问题,自己也加了cookie池,是不是因为没有换代理ip的问题?看了几个git上star多的微博爬虫项目好像都没有提到有这个问题,而且网上也没找到相关的解释,现在暂时只能每次请求等待2-3秒,这速度一天太慢了..
...全文
1878 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
小羽Jary 2019-12-03
  • 打赏
  • 举报
回复
随机header+ip池就可以
weixin_42789202 2019-12-02
  • 打赏
  • 举报
回复
一样怎么解决....
鸡蛋煎饼饭 2019-11-08
  • 打赏
  • 举报
回复
我之前也是这个问题,今天加了headers,每次请求使用fake_useragent构造headers再加上cookie池,现在没有问题了,没出现418问题了。
大岭聊编程 2019-10-10
  • 打赏
  • 举报
回复
大佬 解决了么.用代理也不行
w5555sxa 2019-09-16
  • 打赏
  • 举报
回复
大佬,请问你们解决了吗?418的问题
pandasgb 2019-04-22
  • 打赏
  • 举报
回复
引用 4 楼 weixin_43945615 的回复:
握爪 我也遇到了 我去年就有爬微博数据 当时爬了挺多的没出现过这个问题 现在需要爬些新的数据验证 结果刚发现爬到的稍微快点就会出现418 而且网上也查不到 可能微博新加强了反爬?我再想想办法 你解决了吗
还没有,暂时只能降低速度...
weixin_43945615 2019-04-17
  • 打赏
  • 举报
回复
握爪 我也遇到了 我去年就有爬微博数据 当时爬了挺多的没出现过这个问题 现在需要爬些新的数据验证 结果刚发现爬到的稍微快点就会出现418 而且网上也查不到 可能微博新加强了反爬?我再想想办法 你解决了吗
getlaid 2019-04-16
  • 打赏
  • 举报
回复
而且我等待3秒都不行,还出现418

37,719

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧