哪位大神帮帮忙,看一看python爬虫小白的问题???

L2244662131 2023-02-05 20:15:31

哪位大神帮帮忙,看一看python爬虫小白的问题???

 

 从这样的HTML文档中抓取电影名字

 使用lmxl库时,匹配以下格式:

result = text.xpath('//div/a/@title')

结果是抓取不到数据

更改抓取格式,如下:

result = text.xpath('//div//a/@title')

就可以成功抓取

 这是怎么一回事!!!!

a不是div的子节点吗?

为什么要用子孙节点才能抓取???

为什么要用子孙节点才能抓取???

为什么要用子孙节点才能抓取???

 

 

 

...全文
160 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
盐湖城 2023-02-09
  • 打赏
  • 举报
回复

首先你要定位到需要的a标签的父级标签,比如那个p标签(//p[@class="name"]/a/@title)

37,977

社区成员

发帖
与我相关
我的任务
社区描述
分享Python数据分析、可视化、机器学习、图像处理有关知识和实例
社区管理员
  • 叶庭云
  • 极客飞兔
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧