爬虫问题,请指教

bj_0163_bj 2019-12-27 05:15:39
http://epub.sipo.gov.cn/flzt.jsp

条件随便选一下。填一个公告日2019网页内容,我直接用post 加这个表单,怎么请求的网页状态是202?
怎么能把这个页面打印出来呢?求大神指教



import requests

url='http://epub.sipo.gov.cn/overTran.action'

headers={
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
'Accept-Encoding': 'gzip, deflate',
'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8',
'Cache-Control': 'max-age=0',
'Connection': 'keep-alive',
'Content-Length': '183',
'Content-Type': 'application/x-www-form-urlencoded',
'Cookie': 'wIlwQR28aVgb80S=Lvo.g17PODuZgSBwRw5l_DbhAy2KLizhec2.qPccW7ZlsQGwXuZw4Wb5hOVq5oi8; WEB=20111132; JSESSIONID=FBCDD5153E797C518ED843E3AD1FB331; _gscu_884396235=77173060h9kwt732; _gscbrs_884396235=1; Hm_lvt_06635991e58cd892f536626ef17b3348=1577173065; Hm_lpvt_06635991e58cd892f536626ef17b3348=1577173065; _gscu_7281245=77173064qyzfmc15; _gscbrs_7281245=1; _gscs_7281245=7717306451fjlb15|pv:1; _gscs_884396235=77173060bpjon232|pv:3; wIlwQR28aVgb80T=4uHABazj.0t59Nq6rlCEGno19R_ZV0hQRyKhvNWAOrF48jAvrmpf9HW3lAO8BJGZ6XYZMEPfNUEiGv5qukwGzGvYHOBbXhvfIm6uWdcfupBcuyrmb0lubppaA2QciDK7GQHlwFO2OA8CPAjjVMNlb9vNguNiRhq2MfQC7FkGZT9CkU_yFz8uODRSS5Nr6rgQFGILh073HC18orKQQdnNdpkG7xipEjE1wz_VJb9FNRE6gwtG8ShAIz5sVNWQKSpK6cdrIUAbRWQGZZ84rE_JUFpnly61EJK2KE0duzqw7vQFTAH.jS6_Sx.oqxYhJnvnjPG9T86if_4Becmw.UgqaANEb',
'Host': 'epub.sipo.gov.cn',
'Origin': 'http://epub.sipo.gov.cn',
'Referer': 'http://epub.sipo.gov.cn/flzt.jsp',
'Upgrade-Insecure-Requests': '1',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36'
}




data={'strWord': '法律状态公告日="2019"',
'numType': 18,
'numSortMethod': 4,
'strLicenseCode':'',
'selected':'',
'numFM': 0,
'numXX': 0,
'numWG': 0,
'pageSize': 10,
'pageNow': 1}

rep=requests.post(url,json=data,headers=headers)
...全文
180 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
小羽Jary 2019-12-28
  • 打赏
  • 举报
回复
引用 4 楼 zxc_wolf 的回复:
引用 3 楼 weixin_44729181 的回复:
测试过,它的Cookie只能是使用一次
那怎么解决呢?新的cookie怎么来的
每请求一次然后获取这个cookie去访问下一个页面。每次访问下一页都用当前的cookie
bj_0163_bj 2019-12-28
  • 打赏
  • 举报
回复
引用 5 楼 Jaryy 的回复:
引用 4 楼 zxc_wolf 的回复:
[quote=引用 3 楼 weixin_44729181 的回复:]测试过,它的Cookie只能是使用一次
那怎么解决呢?新的cookie怎么来的
每请求一次然后获取这个cookie去访问下一个页面。每次访问下一页都用当前的cookie[/quote]能帮我改一下,能成功抓到最后成功页面的代码吗?成功的追加200分
bj_0163_bj 2019-12-27
  • 打赏
  • 举报
回复
引用 3 楼 weixin_44729181 的回复:
测试过,它的Cookie只能是使用一次
那怎么解决呢?新的cookie怎么来的
weixin_44729181 2019-12-27
  • 打赏
  • 举报
回复
测试过,它的Cookie只能是使用一次
bj_0163_bj 2019-12-27
  • 打赏
  • 举报
回复
引用 1 楼 Minions_ 的回复:
估计是反爬,可以试试selenium


这个selenium 页面都打不开
Minions__ 2019-12-27
  • 打赏
  • 举报
回复
估计是反爬,可以试试selenium

37,719

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧