使用Scrapy爬虫爬某一field时,同一field有两个不同的xpath,请问该如何将两个xpath归一或者有没有别的办法解决这个问题?
详细问题如下:
在爬某网页的“作者”属性的时候,发现对这一属性有两个xpath:
1."//div[@class='news-info']/dl/dd/span[@class='name']/text()"
2."//div[@class='news-info']/dl/dd/span[@class='name-head']/a/text()"
如何将两个xpath归一?
用正则表达式的话可不可以?