请教一个xpath的问题

oldhunter 2021-01-05 11:04:56

请教一个xpath的问题，需要按text，查询以下节点：

<div class="mini-card-info text-right domoutbox">
<span class="counter">0</span>
Blog
</div>

我写的xpath：//div[contains(text(), 'Blog')]，为什么查询失败呢？
这种节点中，除了有文本，还有其它子节点的情况，应该怎么写判断text的xpath呢？

...全文

10796 4 打赏收藏转发到动态举报

写回复

4 条回复

切换为时间正序

请发表友善的回复…

发表回复

oldhunter 2021-01-06

打赏
举报

回复

引用 3 楼晨易夕的回复:

使用string()函数把div节点中的内容全部转换为文本，再contains不就可以了。
比如
//div[contains(string(), 'Blog')]

使用string会匹配到外层的多个div。我需要只匹配最内层的包含blog字样的div。
不过也非常感谢你的思路！
看有没有其它办法，或xpath的函数可以调用。

晨易夕 2021-01-06

打赏
举报

回复

使用string()函数把div节点中的内容全部转换为文本，再contains不就可以了。比如 //div[contains(string(), 'Blog')]

oldhunter 2021-01-06

打赏
举报

回复

查了这方面的文档，没有找到办法。

highreport 2021-01-05

打赏
举报

回复

看看msdn里面，有关xpath路径用法，好久不用了

本文记录了作者使用XPath查询XML数据的过程，特别是在ASP.NET2.0环境下使用XPath1.0而非XPath2.0的方法，并解决了获取XML文件中某个属性唯一值的问题。

博主在爬取特定网站时遇到XPath选取元素为空的问题，发现复制的XPath路径存在错误。通过逐级检查XPath并对比Elements来定位正确路径，最终找到实际应为div[3]而非div[2]。此过程让博主对XPath有了更深入的理解，并提醒大家在遇到类似问题时不要轻易放弃。

文章介绍了在Python网络爬虫中遇到的一个问题，即在提取表格内容时误提取到页码信息。通过两种解决方案进行了解答：一是使用`pd.read_html`读取表格并删除多余行；二是利用xpath方法结合匿名函数清理无效字符。作者感谢了提供思路和代码的社区成员，并鼓励读者在学习中遇到问题积极交流。,

本文介绍了一个常见的XPath使用误区，即如何正确地从当前元素中选取子元素。通过一个具体的例子展示了在Scrapy框架中，如果不恰当地使用XPath语法可能会导致错误的结果，并给出了正确的解决方案。

博主在检索XML文件时常用'//XXX'查找节点，未考虑其潜在问题。在分析复杂XML文件时，循环中使用doc.SelectNodes('//XXX')导致速度极慢，优化算法效果不佳。后发现'//XXX'会遍历整个XML结构树，注释后时间剧减，提醒不能忽视小问题。

111,129

社区成员

642,540

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧

+ 用AI写文章