NCBI 上SRA爬虫问题

Mr-Kid 2018-12-20 04:06:50
大家好,又来麻烦大家了,作为一个python菜鸟,我觉得我的爬虫项目怎么都在挑战高难度

我这次是爬取NCBI上的信息,从NCBI上获取网址调到SRA(已完成),但是爬取SRA的时候,遇到了问题,比如https://www.ncbi.nlm.nih.gov/Traces/study/?WebEnv=NCID_1_20026402_130.14.18.97_5555_1545272108_2984035102_0MetA0_S_HStore&query_key=4,我一开始以为是异步加载,在xhr中找网址时,发现没有一个符合要求,我不知道是我找的方式不对还是这个隐藏内容不是用ajax这种方法。
这个网页由3张表格构成,我想提取表格一和二中的内容,重点是表格二中download的链接,请大家帮忙看一下这个问题该怎么解决,谢谢
...全文
185 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

37,720

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧