获取京东商品上的子商品sku,

sms88 2018-08-16 12:43:40
例如 https://item.jd.com/7348345.html
这个商品,点击不一样的规格它的价格是不一样的
翻看网页代码,存在
<script charset="gbk">
colorSize: [{"版本":"全网通(6GB 64GB)","skuId":7081550,"颜色":"幻影蓝"},{"版本":"全网通(6GB 64GB)","skuId":7348369,"颜色":"幻影紫"},

这里边的各规格产品的sku是最全的,也是觉得最好分析的。
但怎么获取出来这段数据呢?
...全文
1018 3 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
sms88 2018-08-17
  • 打赏
  • 举报
回复
引用 2 楼 wudamen 的回复:

import requests
import re


url = 'https://item.jd.com/7081550.html'

headers= {
"User-Agent":" Mozilla/5.0 (Linux; U; Android 4.0; en-us; GT-I9300 Build/IMM76D) AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 Mobile Safari/534.30",
"Referer": "https://item.jd.com/7348369.html",
}

response = requests.get(url, headers=headers)
response.encoding = 'gbk'

content = re.findall(r'colorSize: (.*?),\s+warestatus: 1,\s+tips', response.text)

print(content)



谢谢。
我从C/C++转过来的。对Python使用还不熟,对各种库的使用和函数帮助文档的查找都不熟,思维还是局限在C/C++的编程方法,
今天我用类似c的那种字符串查找colorSize:[ 和 ],然后取子串,然后再从子串里正则表达式取skuid的数值。
你的方法读取html的head。
good!
wudamen 2018-08-16
  • 打赏
  • 举报
回复

import requests
import re


url = 'https://item.jd.com/7081550.html'

headers= {
"User-Agent":" Mozilla/5.0 (Linux; U; Android 4.0; en-us; GT-I9300 Build/IMM76D) AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 Mobile Safari/534.30",
"Referer": "https://item.jd.com/7348369.html",
}

response = requests.get(url, headers=headers)
response.encoding = 'gbk'

content = re.findall(r'colorSize: (.*?),\s+warestatus: 1,\s+tips', response.text)

print(content)

wudamen 2018-08-16
  • 打赏
  • 举报
回复
如果只是想要源代码里面这段内容的话可以考虑使用re

37,743

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • WuKongSecurity@BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧