Science上发表的一个聚类算法,新颖简洁。连接如下:
http://blog.jobbole.com/72540/
不过我有个地方没看懂,请教达达指点一二。
===================================================================
聚类分析
在聚类分析中, 通常需要确定每个点划分给某个类簇的可靠性. 在该算法中, 可以首先为每个类簇定义一个边界区域(border region), 亦即划分给该类簇但是距离其他类簇的点的距离小于dc的点. 然后为每个类簇找到其边界区域的局部密度最大的点, 令其局部密度为ρh. 该类簇中所有局部密度大于ρh的点被认为是类簇核心的一部分(亦即将该点划分给该类簇的可靠性很大), 其余的点被认为是该类簇的光晕(halo), 亦即可以认为是噪音.
===================================================================
这个地方所言的边界区域到底啥意思啊?直接没看懂
按照我的理解,聚类步骤,第一步是完成所有点聚类的归属分析,第二部是消除噪声。这个地方引入一个边界区域,具体咋定义的呢?没理解这段话的意思。请熟悉的tx解答下,谢谢了。