关于用正则针对京东数据的采集

ferrari 2013-05-23 10:41:48
http://list.jd.com/737-794-1706-0-0-0-0-0-0-0-1-1-1-1-2-2811-33.html

现在其它的数据都可以抓了,就是商品标题中红色字体的好像在HTML中为空,但是到页面浏览的时候就可以显示。不知道如何抓,请高手指教。高分相送。
...全文
285 12 打赏 收藏 转发到动态 举报
写回复
用AI写文章
12 条回复
切换为时间正序
请发表友善的回复…
发表回复
hfdsoft 2013-06-24
  • 打赏
  • 举报
回复
IE9,F12,切到网络。点开始捕获,再切到商品页刷新一下。。然后找类型为text/json的项。。
hfdsoft 2013-05-23
  • 打赏
  • 举报
回复
装IE9,按F12,网络,开始监听,你就知道它页面加载的时候做了些神马了。 好吧,Chrome神马的也行,但我只会用IE。
hfdsoft 2013-05-23
  • 打赏
  • 举报
回复
那个红色的字是页面加载完后,再次通过ajax获取的,不但它是,下面的优惠信息神马的也是。 地址格式:string.Format("http://jprice.360buy.com/adslogan/{0}-setproductadwords.ad",商品ID)
ferrari 2013-05-23
  • 打赏
  • 举报
回复
嗯,一样的。列表页是因为截掉了没有全部显示,点到详细页就有全部显示了。 想抓这部分红字,不知道如何获取。
游戏人间 2013-05-23
  • 打赏
  • 举报
回复
<font>标记后面不是有吗?
q107770540 2013-05-23
  • 打赏
  • 举报
回复
页面在显示时, 能率(NORITZ) GQ-1150FE 11升 燃气热水器(天然气)后边就已经没有红色字体了啊 只有: 能率11升燃热优惠500元送高档水壶疯抢仅限今日1天 燃热销量冠军 六大精良工艺 四季智能恒温 从此洗澡不再忽冷忽热!
ferrari 2013-05-23
  • 打赏
  • 举报
回复
商品标题中的,比如第一个商品 能率(NORITZ) GQ-1150FE 11升 燃气热水器(天然气)优惠500元送高档水壶疯抢 这个红色的字抓不到,有什么办法可以抓吗?
bdmh 2013-05-23
  • 打赏
  • 举报
回复
你指哪个红色字体,那么多,有些不是静态的文字,需要用模拟提交的方式获取内容
ferrari 2013-05-23
  • 打赏
  • 举报
回复
用IE9抓了一些信息,但是怎么看得出是上面这个接口?
51Crack 2013-05-23
  • 打赏
  • 举报
回复
http://jprice.jd.com/adslogan/482589-setproductadwords.ad RAW: setproductadwords({"AdWordList":[{"waretitle":"\u4F18\u60E0\u0035\u0030\u0030\u5143\u9001\u9AD8\u6863\u6C34\u58F6\u75AF\u62A2\u4EC5\u9650\u4ECA\u65E5\u0031\u5929\u0020\u71C3\u70ED\u9500\u91CF\u51A0\u519B\u0020\u516D\u5927\u7CBE\u826F\u5DE5\u827A\u0020\u56DB\u5B63\u667A\u80FD\u6052\u6E29\u0020\u4ECE\u6B64\u6D17\u6FA1\u4E0D\u518D\u5FFD\u51B7\u5FFD\u70ED\uFF01","wid":482589}]}) JSON: waretitle=优惠500元送高档水壶疯抢仅限今日1天 燃热销量冠军 六大精良工艺 四季智能恒温 从此洗澡不再忽冷忽热!
ferrari 2013-05-23
  • 打赏
  • 举报
回复
明白了。非常感谢。高分送上。以后希望能跟你多学习!
ferrari 2013-05-23
  • 打赏
  • 举报
回复
谢谢楼上的,请问你是怎么看出来的,用什么工具还是其它方法?麻烦指点一下。感觉太NB了。

110,538

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧