使用Scrapy爬虫爬某一field时,同一field有两个不同的xpath,请问该如何将两个xpath归一或者有没有别的办法解决这个问题?

xqhlsjslcy 2016-11-24 02:52:34
详细问题如下:
在爬某网页的“作者”属性的时候,发现对这一属性有两个xpath:
1."//div[@class='news-info']/dl/dd/span[@class='name']/text()"
2."//div[@class='news-info']/dl/dd/span[@class='name-head']/a/text()"
如何将两个xpath归一?
用正则表达式的话可不可以?
...全文
7507 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

246

社区成员

发帖
与我相关
我的任务
社区描述
讨论 Informatica 数据集成相关技术、数据隐私保护相关技术
社区管理员
  • 数据集成社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧