请教kmeans算法实现逻辑？在线求，分数不多了。

hnuyz 2018-12-13 10:55:34

/**
* kmeans聚类算法
*
* @param des1
* 输入向量
* @param cluster
* 聚类数量
* @return
*/
public List<Integer> kMeans(List<double[]> des1, int cluster) {

}

...全文

605 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

aabbabababaa 2019-02-08

打赏
举报

回复

没用过kmeans算法，来学习下

本文介绍了无监督学习中的KMeans聚类算法，包括其与监督学习的区别、工作原理和处理过程。通过Python的sklearn库展示了如何使用KMeans进行数据分组，并提供了两个案例：一是根据课程成绩将数据分为四个组，二是对鸢尾花数据进行降维聚类。此外，还讨论了评估聚类性能的指标，如轮廓系数和CH分数，并在消费数据集上应用KMeans寻找最佳的客户群体划分。

本文系统讲解KMeans聚类算法的核心思想、目标函数（SSE）、迭代优化流程及KMeans++初始化策略；涵盖算法优缺点、K值选择（肘部法则）、评估指标（轮廓系数、Calinski-Harabasz等）；重点介绍Python自实现与sklearn工业级应用，并强调数据预处理（标准化、PCA降维）、图像压缩与用户分群等典型场景。

本文介绍如何使用KMeans算法对股票数据进行分类，通过分析股票交易行情信息确定最佳分类数量，并实现动态股票分类，以辅助量化投资决策。

本文介绍一种基于加权密度与最大最小距离的Kmeans改进算法，通过加权密度降低离群点影响，利用最大最小距离原则选择初始中心，提升聚类稳定性。结合轮廓系数自动确定最优聚类数，增强结果可比性，在中低维数据中表现优于传统Kmeans。

本文深入解析KMeans和DBSCAN两类聚类算法的核心原理与适用场景，结合实战代码展示聚类效果评估与可视化方法；同时介绍TF-IDF文本特征提取技术，涵盖词频、逆文档频率计算及其在关键词提取中的应用，适用于NLP任务中的文本表示与分析。

1,097

社区成员

969

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章