Python大数据-对淘宝用户的行为数据分析
数据获取本次数据是在网上获取的来源于: 数据集-阿里云天池 ,不在进行抓取或收集,大家可以看这篇文章Python爬虫-抓取数据到可视化全流程的实现,详细的写了数据抓取的过程数据清洗首先该数据是在多个文件下的CSV文件,通过递归对文件夹内所有文件进行查询,并合并了所有的指定文件,具体的操作步骤大家可以看数据集-阿里云天池这篇文章,里边详细的写了如何遍历所有文件夹,如何组合,如何批量的打开文件目录下的所有文件,并对多文件下的文件进行合并,本文就不再赘述数据合并的过程了,直接采用合并后的数据,大家不懂可