有木有熟悉science发表的一个简洁聚类分析算法的tx啊？进来看看

teleinfor 2016-07-29 05:39:54

Science上发表的一个聚类算法，新颖简洁。连接如下：
http://blog.jobbole.com/72540/
不过我有个地方没看懂，请教达达指点一二。
===================================================================
聚类分析
在聚类分析中, 通常需要确定每个点划分给某个类簇的可靠性. 在该算法中, 可以首先为每个类簇定义一个边界区域(border region), 亦即划分给该类簇但是距离其他类簇的点的距离小于dc的点. 然后为每个类簇找到其边界区域的局部密度最大的点, 令其局部密度为ρh. 该类簇中所有局部密度大于ρh的点被认为是类簇核心的一部分(亦即将该点划分给该类簇的可靠性很大), 其余的点被认为是该类簇的光晕(halo), 亦即可以认为是噪音.
===================================================================

这个地方所言的边界区域到底啥意思啊？直接没看懂

按照我的理解，聚类步骤，第一步是完成所有点聚类的归属分析，第二部是消除噪声。这个地方引入一个边界区域，具体咋定义的呢？没理解这段话的意思。请熟悉的tx解答下，谢谢了。

...全文

613 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

聚类分析又称群分析，它是研究（样品或指标）分类问题的一种统计分析方法，同时也是数据挖掘的一个重要算法。本视频课程主要讲解：聚类的任务、性能度量、距离计算、原型聚类、密度聚类、层次聚类等知识。

今年 6 月份，Alex Rodriguez 和 Alessandro Laio 在 Science 上发表了一篇名为《Clustering by fast search and find of density peaks》的文章，为聚类算法的设计提供了一种新的思路。虽然文章出来后遭到了众多...

聚类分析是指将数据对象的集合分组为由类似的对象组成的多个类的分析过程。基本概念聚类（Clustering）就是一种寻找数据之间内在结构的技术。聚类把全体数据实例组织成一些相似组，而这些相似组被称作簇。处于...

K-means：K-means聚类算法是一种迭代求解的聚类分析算法，其步骤是随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给...

1. K-Means(K均值)聚类算法步骤： (1) 首先我们选择一些类/组，并随机初始化它们各自的中心点。中心点是与每个数据点向量长度相同的位置。这需要我们提前预知类的数量(即中心点的数量)。 (2) 计算每个数据点到...

Hadoop生态社区

20,808

社区成员

4,690

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章