• 全部
  • 互动交流
  • 文章分享

请问为什么我使用xpath解析得不到我想要的结果

stream_ 2021-02-16 01:51:49
想要下载页面,解析这一部分

google右键获得full XPath的链接是这样:
/html/body/div[3]/div[1]/div[5]/div[1]/div[2]/a[2]
我的代码:



url = "https://nj.zu.ke.com/zufang/caochangmendajie/"

page=etree.HTML(Download.downloadPage(url)) #下载页面,获取页数

nums = page.xpath('/html/body/div[3]/div[1]/div[5]/div[1]/div[2]/a[2]/text()')
print(nums)

请问为什么结果是空
...全文
132 点赞 收藏 4
写回复
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
xpath语法是没有错误的,好像楼主要爬取的这部分内容是动态生成的,所以无法得到,楼主查看网页源代码就可以发现了
回复
stream_ 02-19
谢谢各位的帮助,我在stackoverflow提问后得到了解答https://stackoverflow.com/questions/66219173/when-writing-a-crawler-why-cant-i-get-results-using-xpath/66221128#66221128 使用如下xpath就可以获得页面总数 ("//div[@class='content__pg']/@data-totalpage")
回复
hitomisky 02-17
额,好像你用的就是谷歌,试试装xpath help 插件,复制路径进去看看是不是有你想要的数据,
回复
hitomisky 02-17
换浏览器,用谷歌浏览器的复制xpath功能会获得正确的xpath路径,别用火狐的,亲身经历
回复
发帖
脚本语言
创建于2007-08-27

3.7w+

社区成员

JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
申请成为版主
帖子事件
创建了帖子
2021-02-16 01:51
社区公告

CSDN 脚本语言社区接受专栏投稿(专栏会在顶部创建专属你的栏目),投稿需满足以下要求:

  • 脚本语言技术相关;
  • 文章持续更新,保持活跃;
  • 内容清晰明了,干货为主;
  • 文章排版有序,有条有理。

本社区开通招聘专栏,发布招聘信息请联系版主,发布者需要保证招聘信息真实有效,CSDN 平台和版主不对招聘内容负责!

联系方式:私聊版主、发送邮件、QQ联系等均可: