python 中关于xpath的一点小问题

果、失 2021-04-07 11:44:14

想问一下各位大佬为什么 xpath 在把网页保存在本地然后再打开后就不能使用了呢

这是 url http://books.toscrape.com/

感谢各位大佬的指点

...全文

245 4 打赏收藏转发到动态举报

写回复

用AI写文章

4 条回复

切换为时间正序

请发表友善的回复…

发表回复

果、失 2021-04-08

打赏
举报

引用 3 楼 shoppo0505的回复:

[quote=引用 2 楼果、失的回复:][quote=引用 1 楼 shoppo0505的回复:]每个链接的目标页都下载了么？如果下载了，每个页面里面的链接地址都修改了么？

大佬，没有下载每个目标页面的url[/quote] 那就会出错啊[/quote] 为什么呀，大佬

shoppo0505 2021-04-08

打赏
举报

引用 2 楼果、失的回复:

[quote=引用 1 楼 shoppo0505的回复:]每个链接的目标页都下载了么？如果下载了，每个页面里面的链接地址都修改了么？

大佬，没有下载每个目标页面的url[/quote] 那就会出错啊

果、失 2021-04-08

打赏
举报

引用 1 楼 shoppo0505的回复:

每个链接的目标页都下载了么？如果下载了，每个页面里面的链接地址都修改了么？

大佬，没有下载每个目标页面的url

shoppo0505 2021-04-08

打赏
举报

每个链接的目标页都下载了么？如果下载了，每个页面里面的链接地址都修改了么？

本文通过一个实例讲解了在Python中使用lxml库和XPath进行网页元素定位时遇到的问题。当从父节点开始的XPath定位后，再次使用XPath时，需要使用点.来指定当前节点，否则会重新从根节点开始搜索。例如，对于表格中tr和td的定位，正确做法是使用`.//td`而不是`//td`。理解这一点对于高效地解析HTML文档至关重要。

本文详细介绍了XPath在Python爬虫中的应用，包括基础使用、常用表达式、实例解析以及如何借助浏览器快速获取XPath表达式。通过实例展示了如何提取HTML中的链接、文本、属性等信息，并分享了XPath解析的局限性和避坑指南。最后，通过一个爬取斗图网站表情包的实战案例，演示了XPath在实际爬虫项目中的运用。

本文介绍了XPATH在XML和HTML文档中查找和遍历元素及属性的方法。涵盖了XPath的基础语法、谓语、通配符、选取多个路径等内容，还介绍了Xpath Helper插件的安装与使用。此外，详细说明了Python中使用XPath的步骤，包括安装依赖包、解析XML和HTML内容等。

XPath是一种在XML文档中查找信息的语言，常用于XML和HTML的解析。本文介绍了如何在Python中使用XPath，包括安装、实例化etree、XPath表达式的定位方法（如根据层级、属性、ID和索引定位）以及如何取值（获取文本和属性）。同时，提供了实例代码以加深理解。

本文介绍了XPath作为一种在XML文档中定位节点的标准查询语言，以及如何在Python中使用lxml库进行安装配置。文章详细讲解了XPath的常用规则和案例，同时展示了requests_html库如何结合XPath获取和解析网页内容，包括图片下载的示例。

脚本语言

37,738

社区成员

34,211

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章

python 中 关于xpath的一点小问题

python 中关于xpath的一点小问题