求助 python爬虫 requests的get出现10054错误 远程主机强迫关闭了一个现有的连接

qq_38741240 2017-10-30 02:44:43
使用爬虫出现了这个错误,但是用浏览器不停快速刷新却没问题(禁止了缓存),已经设置了header头,代码如下



urlInfo = urllib.request.urlparse(url);
headers = {
'Host': urlInfo.hostname,
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36',
'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Language':'zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3',
'Accept-Encoding':'gzip, deflate',
'Connection':'keep-alive',
'Upgrade-Insecure-Requests':'1',
'Pragma':'no-cache',
'Cache-Control':'no-cache',

}
...全文
2412 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
cnaaa8 2017-10-31
  • 打赏
  • 举报
回复
使用 selenium 吧
oyljerry 2017-10-30
  • 打赏
  • 举报
回复
应该网站还有其他反扒措施。

37,720

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧