scrapy xpath问题

efly888 2018-10-31 09:43:38

自己做了个爬虫实验，
http://xzsp.cangzhou.gov.cn/HBSC/Services/zwfwzx/a_article.jsp?SiteID=96&aid=d6e389c3-9a3d-40f7-bedf-8f6265b2deb5
想爬出
中标供应商名称中标供应商地址中标金额(元) 统一社会信用代码
杭州求晟科技有限公司浙江省杭州市上城区莫干山路1418-8号3幢（上城科技工业基地） 778,700.00 91330102MA2CC70W8R

<tr><td><table width="650" style="white-space:nowrap;"><tr border="1px" !important><td border="1px" !important colspan="5">包号：Z1309001819492001-2 <br>包名：嵌入式实验室、分布式过程控制实验室设备</td></tr><tr ><td ><table width="650" style="white-space:normal;" border="1" !important><tr ><td width="25%" align="center">中标供应商名称</td><td width="25%" align="center">中标供应商地址</td><td width="25%" align="center">中标金额(元)</td><td width="25%" align="center">统一社会信用代码</td></tr ></table></td ></tr><tr ><td ><table width="650" style="white-space:normal;" !important border="1" !important><tr><td width="25%" align="center" > 杭州求晟科技有限公司 </td><td width="25%" align="center"> 浙江省杭州市上城区莫干山路1418-8号3幢（上城科技工业基地） </td><td width="25%" align="center" > 778,700.00 </td><td width="25%" align="center">91330102MA2CC70W8R</td></tr ></table></td ></tr ><tr ><td ><table width="650" style="white-space:normal;" border="1" !important><tr ><td width="25%" align="center">主要标的名称</td><td width="25%" align="center">规格型号</td><td width="25%" align="center">单价（元）</td><td width="25%" align="center">数量</td></tr ></table></td ></tr ><tr ><td ><table width="650" style="white-space:normal;" border="1" !important><tr ><td width="25%" align="center">详见招标（采购）文件</td><td width="25%" align="center">详见招标（采购）文件</td><td width="25%" align="center">详见招标（响应）文件</td><td width="25%" align="center">详见招标（采购）文件</td></tr ></table></td ></tr ></tr></table></td>

def parse_article(self, response):
detail = response.xpath('//table')
item = ZhongbiaoxxItem()
item['ysje'] = detail.xpath('tr[17]/td/table/tr[1]/td/text()')[0].extract()
item['cgyt'] = detail.xpath('tr[17]/td/table/tr[2]/td/text()')[0].extract()
item['ssdd'] = detail.xpath('tr[17]/td/table/tr[3]/td/text()')[0].extract()

但是得不到，不知道xpath应该怎么写？

...全文

50 2 打赏收藏转发到动态举报

写回复

用AI写文章

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

efly888 2018-11-05

打赏
举报

谢谢，根据开发者工具中提示，写的如下内容，但还是爬不出来
//*[@id="content"]/div/table/tbody/tr[16]/td/table/tbody/tr[3]/td/table/tbody/tr/td[1]

def parse_article(self, response):
detail = response.xpath('//*[@id="content"]/div/table/tbody/')
item = ZhongbiaoxxItem()
item['ysje'] = detail.xpath('tr[16]/td/table/tbody/tr[3]/td/table/tbody/tr/td[1]/text()')[0].extract()
item['cgyt'] = detail.xpath('tr[16]/td/table/tbody/tr[3]/td/table/tbody/tr/td[2]/text()')[0].extract()
item['ssdd'] = detail.xpath('tr[16]/td/table/tbody/tr[3]/td/table/tbody/tr/td[3]/text()')[0].extract()
#a=response.xpath('//a[contains(text(),"闻")]/text()').extract()
yield item

onlycau 2018-11-01