送分贴,请看看我的开源项目
金色数据采集器开源项目,是用于抓取网页和抽取数据的工具。其核心代码是从金色数据采集与融合平台分离而来。
地址:https://gitee.com/golddata/golddata-spider
金色数据平台可以将数据及数据之间关系一并采集下来并融合到关联关系表(不论存在一对多、一对一、自关联、相互关联)中,并且可以反复采集而不产生重复数据。
并且提供了完全免费社区板,不限采集数量 、爬虫数量、导出数据数量。并在官网https://golddata.100shouhou.com/front/docs上提供了文档和培训视频。
如果觉得好,请在oschina上点关注噢!