python爬虫只要post就是403错误

Zjly__ 2019-06-30 06:20:09

已经按照网上的各种方法，添加请求头等各种方法尝试，都是失败的
而且网页采用的是json，直接爬到的源代码是不一样的，需要post信息才能得到
大神们有没有什么办法能够得到这里面的信息并且不403，网址是https://taoke.ziqiang.net.cn/#!/course/public/elective

...全文

987 7 打赏收藏转发到动态举报

写回复

7 条回复

切换为时间正序

请发表友善的回复…

发表回复

ZhuCheng Xie 2019-07-04

打赏
举报

回复

403是访问被拒绝了，应该是缺少什么参数。

小羽Jary 2019-07-03

打赏
举报

回复

def send1(): headers = { "Cookie": "csrftoken=OtRSZCvfwh3iuH6WgzAVYjkYLAUIi4QG", "X-Csrftoken": "OtRSZCvfwh3iuH6WgzAVYjkYLAUIi4QG", "Referer": "https://taoke.ziqiang.net.cn/", "Content-Type": "application/json; charset=utf-8", } postdata = { "per_page": 20, "page": 3 } posturl = 'https://taoke.ziqiang.net.cn/api/course/public/elective/' rep = requests.post(url=posturl, data=json.dumps(postdata), headers=headers) print(rep) print(rep.text) 结帐吧

Zjly__ 2019-07-01

打赏
举报

回复

引用 2 楼 kxltsuperr 的回复:

登录了吗，先模拟登录才行。

登陆的时候post信息就被打回来了，不管在哪个界面都没办法post

看雪山海间 2019-07-01

打赏
举报

回复

登录了吗，先模拟登录才行。

一笑程序猴 2019-07-01

打赏
举报

回复

403是访问被拒绝了，估计是缺少什么参数，或者是需要登录等。

Zjly__ 2019-07-01

打赏
举报

回复

引用 4 楼 So灬低调的回复:

你是要爬取什么内容？

里面的课程信息

So灬低调 2019-07-01

打赏
举报

回复

你是要爬取什么内容？

如果你在使用 Python 爬虫时遇到了 HTTP 状态码 403，这意味着你的爬虫被服务器拒绝了。有很多原因可能会导致这种情况，例如：服务器的安全设置禁止了你的 IP 地址访问服务器需要你提供身份验证凭据(例如用户名和密码) 服务器认为你的爬虫是恶意软件要解决这个问题，你需要找出导致这个问题的原因，然后采取相应的解决措施。例如，你可以尝试更换你的 IP 地址或者给爬虫添加身份验证凭据，...

在解决问题之前，我们首先需要了解Cloudflare的防护机制。在爬虫过程中，我们经常会遇到Cloudflare的防护机制导致的403错误。这种错误提示表示我们的请求被服务器拒绝，往往是由于Cloudflare的反爬虫机制将我们的请求识别为恶意行为。通过使用该库，我们可以成功地绕过Cloudflare的防护机制，实现数据的正常获取。代理服务器可以隐藏我们的真实IP地址，使得我们的请求看起来来自不同的IP。除了上述的解决方法，我们还可以使用穿云API作为终极解决方案来绕过Cloudflare的防护机制。

不要用固定User-Agent！准备个UA池随机切换控制请求频率！建议每秒不超过3次请求及时处理异常！遇到403先暂停而不是继续硬刚尊重robots.txt！有些网站明确禁止爬虫就不要强行抓取最近帮朋友调试一个爬虫时，发现即使用上了所有方法还是403。最后发现是对方网站启用了TLS指纹验证（这种高级反爬就需要更复杂的对抗手段了）。所以网络爬虫本质上是场攻防战，需要持续学习新技术！（超级重要）最后提醒：技术无罪，但请遵守法律法规和网站的使用条款！爬取公开数据时也要注意不要对目标服务器造成过大压力～

python爬虫之post请求ajax数据

@【python爬虫】—爬虫报错：403访问太过频繁，禁止访问前言使用requests包建立访问时，正常的访问状态会返回状态代码200，但是在爬一些网站时，经常会返回403（众所周知的404代表的是网站disappear了。而403代表我们当前的IP被forbidden了）。这是因为在短时间内直接使用Get获取大量数据，会被服务器认为在对它进行攻击，所以拒绝我们的请求，自动把电脑IP封了。因此，这里介绍两种解决办法。方案一、请求页面的是添加headers 我们平时使用浏览器下载的图片或者是文

37,743

社区成员

34,211

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章