Excel实战:如何抓取1688商品数据

tinagirlapi 2024-02-22 15:15:16

 

 

接着上次话题,今天继续讲解如何使用网页抓取函数 GetTableByClassNameW(url, css) 抓取1688网站上商品规格型号、价格及库存等数据。

 

如下图所示,打开一个1688网页,要求抓取规格、价格、库存等数据【1688商品详情API接口可一键采集】。

 

根据网页结构,我们很容易知道规格、价格、库存在一张表格中,于是,我们使用Firefox火狐浏览器的检查元素功能,找到表格的样式名或id。

 

从源代码中,找到表格table的class名称是table-sku

 

接下来,在excel表中写公式 =GetTableByClassNameW(A2,"table-sku"),打开Excel浏览器启动网页抓取任务。

 

Excel浏览器完成抓取任务后,回到Excel中,重新计算公式,会得到以下数据。

 

公式返回的数据是一长串文本,仔细观察,我们发现“-+缺货;”是表格中每一行的最后一个关键词,为了阅读方便,我们按照关键词“-+缺货;”来换行。

  •  
  •  
  •  
  •  
  •  
  •  
1.5米10灯电池款;6.50元;7190套可售;-+缺货;3米20灯电池款;11.00元;9488套可售;-+缺货;3米20灯usb款;11.00元;9941套可售;-+缺货;6米40灯电池款;21.00元;9994套可售;-+缺货;6米40灯usb款;21.00元;9997套可售;-+缺货;......

使用函数Split2Row(data!A1:B18,2,"-+缺货;")将抓取到的表格数据拆分一行一行的。函数中data!A1:B18指表格区域,2指表格第二列是明细行数据,需要拆分,"-+缺货;"是关键词,按此关键词拆分。

 

 拆分后的数据还需要进一步加工,使用公式=Split2Column(B3,";")继续拆分数据,将规格、价格、库存拆分成列。这里按分号";"拆分。

 

经过以上步骤,使用Excel网络函数库的网页抓取函数可以抓取网页数据并进行数据加工处理。看上去有点难,但相比学习Python编程,写个公式要容易得多呢。

...全文
2970 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

173,785

社区成员

发帖
与我相关
我的任务
社区描述
面向想学习大数据的朋友提供交流园地,社区管理员Lansonli将长期面向社区进行组织技术交流活动。欢迎各位朋友加入大数据联盟,本社区诚邀各位推广投稿。
大数据数据仓库hadoop 个人社区 广东省·深圳市
社区管理员
  • Lansonli
  • 江戸川柯北
  • 字母哥哥
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

诚挚的邀请大家加入大数据联盟,在这里您可以结实挚友、提升技术、分享经验、成就自己

【社区活动】本社区受官方长期扶持,您可以通过活动打造个人IP,让更多的人受益于您的分享,同时我们还会奉上精美周边;

试试用AI创作助手写篇文章吧