Excel实战:如何抓取1688商品数据

电商数据girl 2023-08-16 09:58:15

 

我们可以通过多种方式获得1688商品数据,自己爬取可以得到少量数据,也可以通过第三方服务接入官方API接口

接着上次话题,今天继续讲解如何使用网页抓取函数 GetTableByClassNameW(url, css) 抓取1688网站上商品规格型号、价格及库存等数据。

 

如下图所示,打开一个1688网页,要求抓取规格、价格、库存等数据。

 

根据网页结构,我们很容易知道规格、价格、库存在一张表格中,于是,我们使用Firefox火狐浏览器的检查元素功能,找到表格的样式名或id。

 

从源代码中,找到表格table的class名称是table-sku

 

接下来,在excel表中写公式 =GetTableByClassNameW(A2,"table-sku"),打开Excel浏览器启动网页抓取任务。

 

Excel浏览器完成抓取任务后,回到Excel中,重新计算公式,会得到以下数据。

 

公式返回的数据是一长串文本,仔细观察,我们发现“-+缺货;”是表格中每一行的最后一个关键词,为了阅读方便,我们按照关键词“-+缺货;”来换行。

  •  
  •  
  •  
  •  
  •  
  •  
1.5米10灯电池款;6.50元;7190套可售;-+缺货;3米20灯电池款;11.00元;9488套可售;-+缺货;3米20灯usb款;11.00元;9941套可售;-+缺货;6米40灯电池款;21.00元;9994套可售;-+缺货;6米40灯usb款;21.00元;9997套可售;-+缺货;......

使用函数Split2Row(data!A1:B18,2,"-+缺货;")将抓取到的表格数据拆分一行一行的。函数中data!A1:B18指表格区域,2指表格第二列是明细行数据,需要拆分,"-+缺货;"是关键词,按此关键词拆分。

 

 拆分后的数据还需要进一步加工,使用公式=Split2Column(B3,";")继续拆分数据,将规格、价格、库存拆分成列。这里按分号";"拆分。

 

经过以上步骤,使用Excel网络函数库的网页抓取函数可以抓取网页数据并进行数据加工处理。看上去有点难,但相比学习Python编程,写个公式要容易得多呢。

 

 

...全文
791 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

225,210

社区成员

发帖
与我相关
我的任务
社区描述
一个人可以走的很快,一群人才能走的更远!
数据库 企业社区
社区管理员
  • Lucifer三思而后行
  • 韬光养晦208
  • 芒果再努力
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

❤️ 添加版主微信:Lucifer-4622 

🎉【数据库交流社区】联合 【摸鱼社区】本周重磅推出【兄弟社区每日打卡】活动 

🎁 新玩法,奖励升级!

数据库交流社区:https://bbs.csdn.net/forums/lucifer-database

摸鱼社区:https://bbs.csdn.net/forums/moyu

新增抽奖池:6本技术书籍 📚 + 每周社区排名奖品 🏅 ,绝对丰厚!

奖品预览可以参考:CSDN社区赞助奖品一览

⭐️ 活动要求:

1、每日 同时在两个社区 打卡贴进行发帖打卡,提交任务

2、同时在两个社区 坚持 7 天打卡 ,将参与到抽奖名单中,这很重要!

3、参加抽奖请先 添加打卡抽奖群,否则无效,加群请添加微信:Lucifer-4622

【社区积分规则】

  • 在社区「发帖」得10积分
  • 内容被管理员「加精」得10积分
  • 点赞他人内容得1积分
  • 评论内容得2积分

社区玩法👇👇👇

试试用AI创作助手写篇文章吧