爬虫返回500HTTP码是怎么回事?

Mock_pipi 2015-04-19 08:29:58
1.用Python的scrapy写了一个基于BaseSpider的爬虫爬取一个网站,成功
2.用基于CrawlSpider的爬虫爬取同一个网站,返回500,如图

求助是怎么回事?
...全文
1372 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
shuidi021 2018-09-15
  • 打赏
  • 举报
回复
我的网站也遇到类似情况, 百度站长抓取提示“服务器错误:爬虫发起抓取,httpcode返回码是5XX ”, 求大神帮忙分析一下我的网站,www.oushenwenji.net,谢谢!
principl 2016-02-16
  • 打赏
  • 举报
回复
你试试用浏览器看能访问吗?如果不能,很可能是服务器被你爬崩溃了,有些小站点经不住爬虫快速爬取的。
anmei4946286527 2016-02-15
  • 打赏
  • 举报
回复
引用 4 楼 hoho941111 的回复:
楼主解决了吗 我也碰到。。。
你爬的是知乎嘛。。?
anmei4946286527 2016-02-15
  • 打赏
  • 举报
回复
楼主爬的是知乎嘛。。?我猜的,因为我也遇到相同的情况= =
白白洗白白 2016-02-04
  • 打赏
  • 举报
回复
楼主解决了吗 我也碰到。。。
Mock_pipi 2015-04-22
  • 打赏
  • 举报
回复
引用 2 楼 macrojj 的回复:
这是JS 访问服务器报的错。 说明你这两个爬虫对JS的支持不一样。
可是代码里并没有涉及JS
macrojj 2015-04-21
  • 打赏
  • 举报
回复
这是JS 访问服务器报的错。 说明你这两个爬虫对JS的支持不一样。
_Neo 2015-04-20
  • 打赏
  • 举报
回复
服务器出错,等待大神解答

37,719

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧