开发环境:Pycharm工具,Python3.7环境
1 内容简介
首先通过爬虫采集链家网上所有南京二手房的房源数据,并对采集到的数据进行清洗;然后,对清洗后的数据进行可视化分析,探索隐藏在大量数据背后的规律;最后,采用一个聚类算法对所有二手房数据进行聚类分析,并根据聚类分析的结果,将这些房源大致分类,以对所有数据的概括总结。通过上述分析,我们可以了解到目前市面上二手房各项基本特征及房源分布情况,帮助我们进行购房决策。
2 应用技术介绍
(1)Python网络爬虫技术 Requests Beautifulsoup (2)Python数据分析技术 Numpy Matplotlib Pandas (3)k-means聚类算法 (4)高德地图开发者应用JS API
, 相关下载链接:
https://download.csdn.net/download/qq_36584673/89080198?utm_source=bbsseo