python爬虫中碰到IndexError: list index out of range问题

蔚蔚蔚_蓝天 2018-08-16 04:38:56

soup = BeautifulSoup ( html, "lxml" )

trs = soup.find_all('tr')[1:]

movies = []

for tr in trs:

    movie = {}

    tds = tr.find_all("td")

    title = tds[0].string

    category = tds[1].string

    nums = tds[2].string

    city = tds[3].string

    time = tds[4].string

    movie['title'] = title

    movie['category'] = category

    movie['nums'] = nums

    movie['city'] = city

    movie['time'] = time

    movies.append(movie)

print(movies)

代码如上，会显示如下错误：

Traceback (most recent call last):

  File "E:/资源/python 爬虫/bs4_hj/123123.py", line 138, in <module>

    category = tds[1].string

IndexError: list index out of range

小白技术有限，但是觉得应该是tds列表问题，但是不知道怎么修改，可以指导一下吗

...全文

1844 8 打赏收藏转发到动态举报

写回复

8 条回复

切换为时间正序

请发表友善的回复…

发表回复

蔚蔚蔚_蓝天 2018-08-16

打赏
举报

回复

引用 6 楼 wudamen 的回复:

上面这行代码改为
if len(tds) > 5:

我还是想问一下，这里为什么不加判断就不会成功

蔚蔚蔚_蓝天 2018-08-16

打赏
举报

回复

引用 6 楼 wudamen 的回复:

上面这行代码改为
if len(tds) > 5:

应该是if len(tds)>4就好了
谢谢了

wudamen 2018-08-16

打赏
举报

回复



soup = BeautifulSoup ( html, "lxml" )

trs = soup.find_all('tr')[1:]

print(trs)  # 查看一下这里是否有数据

movies = []

for tr in trs:

    movie = {}

    tds = tr.find_all("td")  # 你这里是 遍历trs，查找带有td的数据，如果没有的话使用tds[0] 获取下标会报错

    if len(tds) > 0:

	    title = tds[0].string 

	    category = tds[1].string

	    nums = tds[2].string

	    city = tds[3].string

	    time = tds[4].string

	    movie['title'] = title

	    movie['category'] = category

	    movie['nums'] = nums

	    movie['city'] = city

	    movie['time'] = time

	    movies.append(movie)

print(movies)

假设这个还不是很理解的话，最好学习一下Python的基础语法

wudamen 2018-08-16

打赏
举报

回复

上面这行代码改为
if len(tds) > 5:

欢乐的小猪 2018-08-16

打赏
举报

回复

我看你这个index01234，你就先判断这个列表长度等于5，再进行下面的。

数据规整，代码就没错。。。

蔚蔚蔚_蓝天 2018-08-16

打赏
举报

回复

引用 1 楼 hbu_pig 的回复:

tds列表没有那么多数据。你可以判断列表的长度

如果没有那么多数据，这段代码就是纯错误的吗

蔚蔚蔚_蓝天 2018-08-16

打赏
举报

回复

引用 1 楼 hbu_pig 的回复:

tds列表没有那么多数据。你可以判断列表的长度

这个具体怎么操作，我学习的视频上老师为什么成功了

欢乐的小猪 2018-08-16

打赏
举报

回复

tds列表没有那么多数据。你可以判断列表的长度

1、本爬虫是爬取豆瓣网站上的TOP 250 图书信息，相关网址：https://book.douban.com/top250 2、本爬虫用到的模块有 requests,lxml,time 注：本程序只作为业余学习，程序中，对于“IndexError: list index out of range”报错，已经做了完美解决。

Python 【IndexError: list index out of range】报错及解决过程缘起这两年，python是如火如荼，许多人都在学python，我也不例外，最近利用业余时间在家学习使用python爬取信息。这两天，我基于scrapy，利用有限的时间写了个比较简陋的爬虫去爬一些素材网站，睡觉时开启爬虫。第二天起来发现，查看数据库，只有4k+条数据,这个程序只爬了几个小时,...

已解决（Python爬虫遍历列表报错）IndexError: list index out of range

爬虫时出现 IndexError: list index out of range 的原因有两种：简单举例如下：第一种情况: index越界 Alex = [1,2,3] Alex[1] 2 Alex[0] 1 Alex[2] 3 Alex[3] Traceback (most recent call last): File "<input>", line 1, in &...

错误现场python在写爬虫的时候，出现如下错误：IndexError: list index out of range原因：爬虫在做xpath时候匹配到空值如图：导致爬去数据的时候出错如下图：解决办法：采用python三目运算过滤空值情况，三目运算规则：为真时的结果 if 判断条件 else 为假时的结果（注意，没有冒号）例如：x = x+1 if x%2==1 else x #当x为...

37,743

社区成员

34,212

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章