如何抓取天猫商品交易记录

wo554006164 2014-05-20 01:16:01
最近在写一个抓取天猫商品信息的软件,在抓取交易记录时,怎么也抓不下来
我用了两种方式:
1.能过fiddler获取到查询交易记录的网址,在浏览器中直接访问,但显示“({"isSuccess":false})”,看来是传的参数经过加密的,只好用winform中的webbrowser控件
2.用winform中的webbrowser控件,但打开一个商品详情页时,出现了JS错误,然后交易记录就始终无法显示出来

最终都没能抓出数据

求教各位,怎么抓取天猫的商品交易记录
...全文
2802 17 打赏 收藏 转发到动态 举报
写回复
用AI写文章
17 条回复
切换为时间正序
请发表友善的回复…
发表回复
superdai 2015-03-05
  • 打赏
  • 举报
回复
通过协议应该是可以的,试了下就是速度要控制。
hanyegudeng 2014-11-20
  • 打赏
  • 举报
回复
用python实现对天猫所有商品,交易额,交易记录的全程抓取,工程量不小,需要抓取服务器集群支持。
g394100942 2014-11-13
  • 打赏
  • 举报
回复
引用 5 楼 a252744386 的回复:
还碰巧真会,这是抓到的片段: 威伯洛施 女凉鞋平底凉鞋女 夏季羊皮罗马真皮平跟夹趾夹脚凉鞋女 <br/> 颜色分类:金色;尺码:35 </td> <td> <a href=\"http://www.tmall.com/go/act/sale/sjzxj.php\" target=\"_blank\" class=\"tm-buy-prom\" >手机专享</a> </td> <td>1</td> <td>2014-05-22 16:54:05</td> <td>成交 </td> </tr> <tr > <td class=\"cell-align-l\"> 幸<span class=tb-anonymous>**</span>5 <img src=\"http://pics.taobaocdn.com/newrank/b_blue_2.gif\" title=\"50 需要联系我qq 252744386
你抓取的时候碰到某一天的数据窜到其他天的情况没?就是其他天也有当前天的一二条数据?
gggidt 2014-07-19
  • 打赏
  • 举报
回复
楼主,这个问题,你解决了吗?
changjiangzhibin 2014-05-30
  • 打赏
  • 举报
回复
呵呵
dychen1026 2014-05-29
  • 打赏
  • 举报
回复
引用 8 楼 zzx112358 的回复:
UP
你的qq确实需要验证的,呵呵。
dychen1026 2014-05-29
  • 打赏
  • 举报
回复
我也遇到这个问题了,LZ弄好了吗?
a252744386 2014-05-27
  • 打赏
  • 举报
回复
引用 6 楼 wo554006164 的回复:
[quote=引用 5 楼 a252744386 的回复:] 还碰巧真会,这是抓到的片段: 威伯洛施 女凉鞋平底凉鞋女 夏季羊皮罗马真皮平跟夹趾夹脚凉鞋女 <br/> 颜色分类:金色;尺码:35 </td> <td> <a href=\"http://www.tmall.com/go/act/sale/sjzxj.php\" target=\"_blank\" class=\"tm-buy-prom\" >手机专享</a> </td> <td>1</td> <td>2014-05-22 16:54:05</td> <td>成交 </td> </tr> <tr > <td class=\"cell-align-l\"> 幸<span class=tb-anonymous>**</span>5 <img src=\"http://pics.taobaocdn.com/newrank/b_blue_2.gif\" title=\"50 需要联系我qq 252744386
你直接帖代码啊,你QQ要回答问题才能加的。[/quote] 现在不需要答案了,直接贴代码怕用的人多天猫把这个抓取给限制了,我最近还是要抓的
save4me 2014-05-24
  • 打赏
  • 举报
回复
登录后提取_tb_token_这个Cookie。因为这个Cookie是HttpOnly的, 无法从CookieContainer上直接检索,见http://msdn.microsoft.com/zh-cn/library/system.net.cookie%28VS.95%29.aspx 获取HttpOnly的Cookie的方法很多,比如通过调用wininet.dll的API,使用InternetGetCookieEx函数,可以手动通过从Set-Cookie头文件中提取,或者查询response.Cookies,然后再发送请求的时候一起提交就可以了。 下面是一个查询response.Cookies的方法:

public static void PrintCookies(HttpWebResponse response)
        {
            if (response == null)
                return;

            Console.WriteLine(string.Format("\n响应网页 {0} 的Cookie如下:", response.ResponseUri.AbsoluteUri));
            foreach (Cookie cookie in response.Cookies)
            {
                Console.WriteLine("Cookie name: " + cookie.Name);
                Console.WriteLine("Cookie value: " + cookie.Value);
                Console.WriteLine("Cookie path: " + cookie.Path);
                Console.WriteLine("Cookie secure: " + cookie.Secure);
                Console.WriteLine("Cookie httponly: " + cookie.HttpOnly);
                Console.WriteLine("Cookie timestamp: " + cookie.TimeStamp);
            }
        }
wo554006164 2014-05-23
  • 打赏
  • 举报
回复
引用 5 楼 a252744386 的回复:
还碰巧真会,这是抓到的片段: 威伯洛施 女凉鞋平底凉鞋女 夏季羊皮罗马真皮平跟夹趾夹脚凉鞋女 <br/> 颜色分类:金色;尺码:35 </td> <td> <a href=\"http://www.tmall.com/go/act/sale/sjzxj.php\" target=\"_blank\" class=\"tm-buy-prom\" >手机专享</a> </td> <td>1</td> <td>2014-05-22 16:54:05</td> <td>成交 </td> </tr> <tr > <td class=\"cell-align-l\"> 幸<span class=tb-anonymous>**</span>5 <img src=\"http://pics.taobaocdn.com/newrank/b_blue_2.gif\" title=\"50 需要联系我qq 252744386
你直接帖代码啊,你QQ要回答问题才能加的。
a252744386 2014-05-22
  • 打赏
  • 举报
回复
还碰巧真会,这是抓到的片段: 威伯洛施 女凉鞋平底凉鞋女 夏季羊皮罗马真皮平跟夹趾夹脚凉鞋女 <br/> 颜色分类:金色;尺码:35 </td> <td> <a href=\"http://www.tmall.com/go/act/sale/sjzxj.php\" target=\"_blank\" class=\"tm-buy-prom\" >手机专享</a> </td> <td>1</td> <td>2014-05-22 16:54:05</td> <td>成交 </td> </tr> <tr > <td class=\"cell-align-l\"> 幸<span class=tb-anonymous>**</span>5 <img src=\"http://pics.taobaocdn.com/newrank/b_blue_2.gif\" title=\"50 需要联系我qq 252744386
wo554006164 2014-05-20
  • 打赏
  • 举报
回复
引用 3 楼 moranhuoshou 的回复:
这个得淘宝的API接口吧,淘宝程序员 不能留这种漏洞给你随意抓取数据的。。。。。。。。。。
能够通过浏览器查看到,那么就应该能抓取到
SeeYou孙悟空 2014-05-20
  • 打赏
  • 举报
回复
这个得淘宝的API接口吧,淘宝程序员 不能留这种漏洞给你随意抓取数据的。。。。。。。。。。
Landy_cc 2014-05-20
  • 打赏
  • 举报
回复
如果winform 的webBroswer 的Js错误的话可以在webBroswer属性里设置 this.webBrowser1.ScriptErrorsSuppressed = true;
wo554006164 2014-05-20
  • 打赏
  • 举报
回复
交易记录的地址:http://ext.mdskip.taobao.com/extension/dealRecords.htm?_ksTS=1400562648169_1086&callback=jsonp1087&bid_page=1&page_size=15&is_start=false&item_type=b&ends=1400811421000&starts=1400206621000&item_id=37653837000&user_tag=35196960&old_quantity=3965&seller_num_id=731510549&isFromDetail=yes&totalSQ=2915&sbn=72a70b466362972438bd763de37d0083&sold_total_num=1570&ua=227fCJmZk4PGRVHHxtNZngkZ3k%2BaC52PmgTKQ%3D%3D%7CfyJ6ZyBzMW0oanQqaH8jYRA%3D%7CfiB4D150Q1JSSgMWB1MdRUsAQR9Uc24mJT5vcCZXeQ%3D%3D%7CeSRiYjNhJ34%2Bf2w9cW40cW0ocTN0MnVlM3VrNnVgKnA2bC5ufDkQ%7CeCVoaEASTBRUGAdMCRxcCgYABBwESUhdXRANFwIMIhw%3D%7CeyR8C0ofXBlYGQdMCR5LDw9PFF4HWx4KVREbRgIcWxRXDEQAClQZCzoT%7CeiJ6DVx1WHB0dCASKi5uLTd8M3kmZDwifTgnezhJZw%3D%3D%7CdS93AFEQThZRCR9UEQ9SEg9OGDcD%7CdCx0A1J7Vn1%2FaiIhFEZeWFYJXRtBHV9BEEhfC05WF0cANBk%3D%7Cdy93AFFRTEtPXhYFU1kGQ1oFVBBNEVBEF1VBHVorBQ%3D%3D%7Cdi52AVARTxJTFhxKBhNTEgxLHlQPR24V%7CcShwB1YXSXs5eGohYHc3cW0maS9zL2J1PntpWAAcQwJSF1IUBlYaDlpzAg%3D%3D%7CcChwB1YXSRNbGBJECAJbHQVOHVYLJg8%3D%7CcytzBFUUShRWGhBDDh1dHAdAFlELSWAb%7CcipyBVR9UHt5bCQnEkBYXlAPWR1AHFxLHUVWDUxQEUEGMh8%3D%7CbTRsG0oLVWciZHY9emo%2BFxdUG0sAXB0MXhoLUhZnSQ%3D%3D%7CbDZuGUgJVw9HHwlCAxJLDhpdCiUR%7CbzdzbzBjPWY6f207Y3YvbGwrZCd%2BImR7MHx2LXVvMGIkYSV9aCNlbzJ2djdkSw%3D%3D&


但通过直接复制地址不能获取到数据
Shopbuilder与Mallbuilder最大的区别就在于Mallbuilder构建的是多用户系统,而Shopbuilder构建的是单用户系统。 ShopBuilder的解决方案打造品牌实力, 建立美观的个性化商城,展示品牌实力,塑造品牌形象 把客户留在自己的地盘 集市平台上的生意永远只会埋没在一堆搜索结果里,只有自己商城的结果才属于自己 多渠道获取客户 把淘宝、拍拍上下过订单的用户直接抓取转化为商城会员 获取更多推广机会 竞争激烈的淘宝店铺已经没有机会获取流量,淘外机会却越来越多。 ShopBuilder的核心亮点 多套品牌商城模版,快速搭建单用户商城 多平台,多店铺数据同步更新 打通淘宝、天猫、拍拍、QQ商城四大平台,多渠道汇集会员数据,客户统一营销 多种信任登陆,打通全网客户 支持QQ、微博、淘宝等多种平台账号登录,覆盖8亿以上互联网用户无障碍购买与客户资料获取 面向搜索引擎深度优化,流量轻松获取 系统针对五大搜索引擎:百度、谷歌、360、搜狗、必应进行全站深度优化,数倍提升收录数量与排名权重 支持多种促销规则,彻底黏住客户 顾客注册、下单、推荐等每一个流程都可实现营销机会,通过送优惠券、打折、买就送、秒杀、团购等一切办法留住顾客 群发优惠券,点燃老客户 曾将注册、下单的老客户一直没再购买?生成一批折扣券,用折扣在此激活他们 内置生意经,流量转化轻松监控 有多少客户访问网站,有多少客户下单,有哪些商品卖的最好·····运营数据一个不漏 shopbuilder最新版本4.1,更新记录为: 1.网银在线 2.充值卡 3.产品购买bug 4.收藏首页bug 5.分站顶级域名 6.网站二维码 7.产品详细页bug
天猫商城是一个基于SSM框架的综合性B2C电商平台,需求设计主要参考天猫商城的购物流程:用户从注册开始,到完成登录,浏览商品,加入购物车,进行下单,确认收货,评价等一系列操作。 作为模拟天猫商城系统的核心组成部分之一,采用SSM框架的天猫数据管理后台包含商品管理,订单管理,类别管理,用户管理和交易额统计等模块,实现了对整个商城的一站式管理和维护。本课程是一门专业的Java微服架构开发实战课程,主要讲解了当下流行的SpringBoot框架、SpringCloud架构以及与第三方技术整合开发实战内容。通过本课程的学习,能够理解并掌握SpringBoot的基础知识,同时能够掌握SpringBoot与常用的第三方技术整合实现实际开发中的业务需求,包括实现Web开发、数据访问、缓存管理、安全管理、消息服务、任务管理等;了解并掌握SpringCloud微服务架构的基础知识及相关组件的应用,掌握微服务架构在企业级开发的实践,建立起微服架构思想。项目技术栈:采用SpringBoot简化商城系统的初始搭建以及开发过程采用SpringMVC+Spring+IBatis完成项目的整合采用Mysql作为数据库存储,Druid配置数据库连接池采用SpringCloud+Netflix 微服务技术栈的实战开发使用Redis完成缓存的数据存储,搭建Redis搭建主从、哨兵、集群应用,保证Redis的高可用使用ElasticSearch全文检索系统进行商品数据搜索,使用ElasticSearch搭建搜索服务的高可用使用Ngnix实现页面动静分离与负载均衡的配置采用FastDFS文件储存系统文件存储,完成广告图片、商品图片的上传和存储系统使用采用CAS+shiro单点登录系统实现用户认证使用ECharts根据后台查询数据生成图表使用POI实现了商城盈利状况的Excel表格导出。商品的详情页使用Thymeleaf完成页面静态化,减少页面数据展示延迟项目中使用SpringBoot下的Aop + 自定义注解完成用户行为记录,日志采集后台管理系统使用Shiro实现登录验证和权限管理(超级管理员、管理员、产品编辑员)项目整合微信完成订单的支付使用Redission完成分布式锁,生成订单的编号使用SpringCloud Alibaba Seat完成下订单模块的分布式事务(新增订单表,库存减少,库存超卖设计)使用RabbitMQ 做消息队列,完成订单未支付自动取消和模块直接的解耦合使用Quartz任务调度,完成缓存的定时刷新,保证缓存的一致性使用本地消息表机制完成消息然队列RabbitMQ消息可靠性传输订单支付模块使用微信扫码支付,并设置订单超时自动取消通过Jquery实现前端校验,通过基于Hibernate的Valida注解实现后端的校验功能使用Base64编码对Json数据传输进行编码和解码项目使用RESTful设计风格实现资源的访问,实现前后端分离项目使用聚合数据第三方短信平台完成用户的登陆功能项目使用SpringBoot整合JavaMail完成邮件的发送项目使用SpringBoot整合Swagger2生成接口文档使用PostMan完成接口的测试项目的测试:SpringTest、dbunit、EasyMock使用Docker 进行应用的自动化打包和发布、自动化测试和持续集成、部署和调整其他应用使用 PowerDesigner,完成数据库的建模项目使用禅道进行BUG管理环境采用Maven实施多模块项目构建,采用Git进行项目版本管理 架构解读:  项目部分截图:              讲义部分截图:          

110,534

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧