在用requests爬区steam的时候遇到了一个问题

少年鬼畜 2019-06-23 12:39:02
steam网页的url如下https://store.steampowered.com/games/#p=1&tab=NewReleases 翻页功能是在#后面的p=?实现的,可是爬虫爬取的时候好像不会向服务器发送#后面的内容 那么应该怎么才能实现对前50页内容的爬取? 周一要交大作业,谢谢各位大佬
...全文
245 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
少年鬼畜 2019-06-23
  • 打赏
  • 举报
回复
我都把数据存成csv了才发现都是重复的数据
少年鬼畜 2019-06-23
  • 打赏
  • 举报
回复
av16952255 b站上的这个视频讲的很明白
少年鬼畜 2019-06-23
  • 打赏
  • 举报
回复
我现在搞懂了,这种异步处理需要用抓包分析出ajax请求的返回值来爬取

37,722

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧