我目前正在准备做获取淘宝,或者其他电商数据的网络爬虫,但是通过几天的学习发现想获取淘宝的数据并没有想象中那么简单,不知道有木有曾经做过的大神,在网上找资料也没发现有多少是可以参考的资料。
初步想法有两种:
第一是利用淘宝提供的API来获取数据,可是真心不太会用淘宝的API,而且利用淘宝提供的API不知道会不会免费?主要还是不知道怎么学习淘宝的API,也就不知道怎么利用API来获取定量的数据。
第二,就是利用网页链接以及正则表达式,通过HttpClient来获取淘宝的页面信息,从而抓出其中的商品信息,可是发现这样实现起来会非常复杂。
知道这里的大神们比较多,所以想求教这个问题,真心求想法,以及可以真正付诸实施的步骤,或者有相关的资料可以推荐给我的,请不吝赐教。