有木有熟悉science发表的一个简洁聚类分析算法的tx啊?进来看看

teleinfor 2016-07-29 05:39:54
Science上发表的一个聚类算法,新颖简洁。连接如下:
http://blog.jobbole.com/72540/
不过我有个地方没看懂,请教达达指点一二。
===================================================================
聚类分析
在聚类分析中, 通常需要确定每个点划分给某个类簇的可靠性. 在该算法中, 可以首先为每个类簇定义一个边界区域(border region), 亦即划分给该类簇但是距离其他类簇的点的距离小于dc的点. 然后为每个类簇找到其边界区域的局部密度最大的点, 令其局部密度为ρh. 该类簇中所有局部密度大于ρh的点被认为是类簇核心的一部分(亦即将该点划分给该类簇的可靠性很大), 其余的点被认为是该类簇的光晕(halo), 亦即可以认为是噪音.
===================================================================

这个地方所言的边界区域到底啥意思啊?直接没看懂
按照我的理解,聚类步骤,第一步是完成所有点聚类的归属分析,第二部是消除噪声。这个地方引入一个边界区域,具体咋定义的呢?没理解这段话的意思。请熟悉的tx解答下,谢谢了。
...全文
613 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

20,808

社区成员

发帖
与我相关
我的任务
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
  • 分布式计算/Hadoop社区
  • 涤生大数据
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧