大家好,又来麻烦大家了,作为一个python菜鸟,我觉得我的爬虫项目怎么都在挑战高难度
我这次是爬取NCBI上的信息,从NCBI上获取网址调到SRA(已完成),但是爬取SRA的时候,遇到了问题,比如https://www.ncbi.nlm.nih.gov/Traces/study/?WebEnv=NCID_1_20026402_130.14.18.97_5555_1545272108_2984035102_0MetA0_S_HStore&query_key=4,我一开始以为是异步加载,在xhr中找网址时,发现没有一个符合要求,我不知道是我找的方式不对还是这个隐藏内容不是用ajax这种方法。
这个网页由3张表格构成,我想提取表格一和二中的内容,重点是表格二中download的链接,请大家帮忙看一下这个问题该怎么解决,谢谢