关于网络爬虫爬取淘宝商品数据的问题。。

小亮子yo 2014-05-07 07:12:37
我目前正在准备做获取淘宝,或者其他电商数据的网络爬虫,但是通过几天的学习发现想获取淘宝的数据并没有想象中那么简单,不知道有木有曾经做过的大神,在网上找资料也没发现有多少是可以参考的资料。
初步想法有两种:
第一是利用淘宝提供的API来获取数据,可是真心不太会用淘宝的API,而且利用淘宝提供的API不知道会不会免费?主要还是不知道怎么学习淘宝的API,也就不知道怎么利用API来获取定量的数据。
第二,就是利用网页链接以及正则表达式,通过HttpClient来获取淘宝的页面信息,从而抓出其中的商品信息,可是发现这样实现起来会非常复杂。
知道这里的大神们比较多,所以想求教这个问题,真心求想法,以及可以真正付诸实施的步骤,或者有相关的资料可以推荐给我的,请不吝赐教。
...全文
33564 23 打赏 收藏 转发到动态 举报
写回复
用AI写文章
23 条回复
切换为时间正序
请发表友善的回复…
发表回复
baidu_30184771 2016-11-03
  • 打赏
  • 举报
回复
引用 15 楼 u012989207 的回复:
楼主你好,我目前也在做淘宝爬虫方面的,同样遇到了你的问题,请问你是否已经解决,或者有什么心得能够分享的?谢谢拉
同求 交流
baidu_30184771 2016-11-03
  • 打赏
  • 举报
回复
楼主做得怎么样了 能交流交流吗
qq_27324295 2016-06-03
  • 打赏
  • 举报
回复
直接调用api不就行了,还用得着去抓取那么麻烦,抓取效率太低了
  • 打赏
  • 举报
回复
同求关注 java httpclient 抓取商品数据功能,有没相关的技术,指点下 目前只知识在发生请求时必须传递cookie信息,不然会返回302。
数据工厂 2016-05-16
  • 打赏
  • 举报
回复
看来我是来拯救大家的了 哈哈哈 推荐你们一个系列教程 专门是讲怎么写电商(包括淘宝啊京东啊)爬虫的,http://blog.csdn.net/youmumzcs/article/details/51373830,写地通俗易懂,绝对干货!
AITAOAITAO 2016-04-30
  • 打赏
  • 举报
回复
求更新。。。。。。。。。。。。。。。
ablackdog 2016-03-08
  • 打赏
  • 举报
回复
求更新啊。。。。
陈不在小胖了 2016-01-18
  • 打赏
  • 举报
回复
楼主你好,我目前也在做淘宝爬虫方面的,同样遇到了你的问题,请问你是否已经解决,或者有什么心得能够分享的?谢谢拉
Smaill_ 2015-12-31
  • 打赏
  • 举报
回复
做淘系导购架构的来回答你这个问题,淘宝、天猫、聚划算能满足你需求的API都是免费的。每天可以调用100W次!
黄小财 2015-07-03
  • 打赏
  • 举报
回复
默默地问下楼主,搞定 了么
会开花的树- 2015-05-13
  • 打赏
  • 举报
回复
嚯嚯```能说一下你的毕业设计最胡怎么解决的吗?准备做一个爬虫scrapy爬取商品价格````` 也是毫无思路呢
编程原理 2014-10-22
  • 打赏
  • 举报
回复
nutch爬虫工具
dengfoby 2014-09-18
  • 打赏
  • 举报
回复
同求啊,做好了说下思路嘛
混沌528 2014-08-11
  • 打赏
  • 举报
回复
哥们儿,你的电商爬取(爬虫)做好了吗? 选用的什么开源框架,或者是选用淘宝,京东的API?
小亮子yo 2014-05-08
  • 打赏
  • 举报
回复
引用 5 楼 rui888 的回复:
和他们联系,通过他们的api 。。
请问你做过类似的么??有木有经验可以传授的??
小亮子yo 2014-05-08
  • 打赏
  • 举报
回复
难不成木有这方面的大神么??????真心求教啊。。。。
小亮子yo 2014-05-08
  • 打赏
  • 举报
回复
作为初学者想请教下。我现在在做毕业设计,方向是获取淘宝的部分数据,利用爬虫或者其他技术。但是我发现利用淘宝的API可能会比较容易,于是着手于淘宝的API研究. 我主要目的是想通过淘宝API以及java代码将淘宝的部分数据保存到SQL SERVER 而已。问题如下: 第一:像我现在只是想获取淘宝的部分数据,在淘宝开放平台创建应用时应该选择买家还是卖家呢? 第二:架构类型看来我只能选择WEB应用了,可是需要填写回调URL,这里我该填写什么URL呢??我只想获得部分数据,真不知道这个URL填写什么。。 第三:URL等东西填写完整以后要不要申请对外发布呢?是不是只有对外发布了才能用App key,App Secret这两个参数呢?? 第四:现在的我一筹莫展啊,不知道该怎么样进行下去,正式环境下tao.user.get 提示我权限不够。 希望大神有时间能够回复下,谢谢了。。。。O(∩_∩)O哈哈~
tony4geek 2014-05-08
  • 打赏
  • 举报
回复
和他们联系,通过他们的api 。。
tony4geek 2014-05-08
  • 打赏
  • 举报
回复
淘宝的数据这么不可能这么好抓的。百度一样。 大公司的数据就是金钱岂能白白流出。
小亮子yo 2014-05-08
  • 打赏
  • 举报
回复
引用 2 楼 huxiweng 的回复:
用API远比你爬虫来的简单
请问你用过淘宝的API么??我真心不太会用淘宝的API的啊。。。大神,有木有这方面的资料之类的,我发现网络并没有太多的资料,求指导。。。
加载更多回复(2)
【课程简介】 本课程适合所有需要弥补python网络爬虫的同学,课件内容制作精细,由浅入深,适合入门或进行知识回顾。 【完整课程列表】 Python网络爬虫教程 数据采集 信息提取课程 01-Requests库入门(共59页).pptx Python网络爬虫教程 数据采集 信息提取课程 02-网络爬虫的盗亦有道(共19页).pptx Python网络爬虫教程 数据采集 信息提取课程 03-Requests库网络爬取实战(共29页).pptx Python网络爬虫教程 数据采集 信息提取课程 04-Beautiful Soup库入门(共53页).pptx Python网络爬虫教程 数据采集 信息提取课程 05-信息标记与提取方法(共49页).pptx Python网络爬虫教程 数据采集 信息提取课程 06-实例1-中国大学排名爬虫(共26页).pptx Python网络爬虫教程 数据采集 信息提取课程 07-Re(正则表达式)库入门(共51页).pptx Python网络爬虫教程 数据采集 信息提取课程 08-实例2-淘宝商品信息定向爬虫(共17页).pptx Python网络爬虫教程 数据采集 信息提取课程 09-实例3-股票数据定向爬虫(共23页).pptx Python网络爬虫教程 数据采集 信息提取课程 10-Scrapy爬虫框架(共34页).pptx Python网络爬虫教程 数据采集 信息提取课程 11-Scrapy爬虫基本使用(共32页).pptx Python网络爬虫教程 数据采集 信息提取课程 12-实例4-股票数据定向Scrapy爬虫(共23页).pptx

50,530

社区成员

发帖
与我相关
我的任务
社区描述
Java相关技术讨论
javaspring bootspring cloud 技术论坛(原bbs)
社区管理员
  • Java相关社区
  • 小虚竹
  • 谙忆
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧