Python爬虫定位标签时,返回空列表
忑忠忐 2019-05-10 09:49:39 a=html.xpath('//li[@class="j_thread_list clearfix"]')
liTags = soup.find_all('li', attrs={'class': ' j_thread_list clearfix'})
用xpath和BeauSoup 抓取这个标签都跪了,结果都是返回一个空列表,这是怎么回事啊,困扰好久了
特别是xpath,经常遇到爬取某个标签运行代码返回空列表,但是使用Chrome 的xpath helper 却能正常捕捉,并且有时候使用别人的原码也会出现这种情况,想知道是哪方面的原因,软件有问题?还是编程哪个细节漏了
使用别人以前的原码也出现过这个问题,某个标签输出返回空列表,后面具体内容就抓不出来了。
打算的是,编个程序,爬取某个贴吧,前3页,把每个帖子(除置顶帖)的标题,作者,创建时间和链接爬取出来,返回成一个列表,里面的元素是每个帖子信息合成的一个字典
分别用 bs4 xpath,正则表达式做
结果做前两个都在定位那个标签时跪了,一直返回空列表
路过的大佬,能详细解答一下吗?尽量从这类问题讲,不限于这个问题