python批量下载文档

穆然wqq 2017-08-12 06:20:46
有没有大佬做过文档批量下载的程序,本来想参照图片批量下载的模式来写的。网上有太多图片、视频爬取的教程了允悲,但是文档的比较少,试了几个都报错。现在准备自己写,无奈还是小白,有没有大佬指导下,拜托
想爬取的文档类似这样!


文档要点进去第一张图里的链接再下载第二张图的链接,不像知网可以直接点链接下载
有没有解决的办法,刚刚查了下网页的源码,下载应该和这个url有关

只有那个末尾的数字有变化
恳求大佬相助,最好有类似的程序能够直接修改,拜谢各位大佬!
另文件格式不定,有doc有pdf
...全文
418 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
Michelle_v 2020-08-15
  • 打赏
  • 举报
回复
请问题主解决了吗?最近我也想批量下载想要的文章。一个一个下载太麻烦了。希望可以交流一下。
穆然wqq 2017-09-05
  • 打赏
  • 举报
回复
博主我用beautifulsoup库找到了文档的链接但是这个链接类似这样guide.do?method=downloadAtt&codeStr=46&type2=2只要在前面加http://www.cde.org.cn/就可以到要下载的文档了。在浏览器里很好实现,可在地址不是".pdf"结尾的不能直接保存为pdf文档,是不是用静态爬虫实现不了了,找不到文档的原始地址。
Jack-Cui 2017-08-12
  • 打赏
  • 举报
回复
匹配哟个Beautifulsoup或者xpath就行,这个不难。 可以参考下我的专栏:http://blog.csdn.net/column/details/15321.html

37,720

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧