关于KMEANS的测试问题

凌石丶释 2013-05-30 10:00:44
我在网上找到一份KMENAS算法的源码,并将它改为基于异构平台的并行算法,可是我不知道如何证明这个代码的正确性问题,就是如何可以使人直观的看到这个代码的正确性呢?求教
...全文
243 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
凌石丶释 2013-06-03
  • 打赏
  • 举报
回复
引用 3 楼 tntzbzc 的回复:
[quote=引用 2 楼 jb250170576 的回复:] [quote=引用 1 楼 tntzbzc 的回复:] LZ,你是怀疑源码的准确性?还是怀疑你改造后的程序? 1、如果怀疑源码的准确性,只能靠测试来获得这套源码的聚类的命中率。 很简单,自己生成一批在已知分类数量的多维度数据,跑个50次,看结果。 2、在两个平台上比较测试 KMEANS结果可能会有出入的,这由维度数量和分类数量有关。 但KMEANS测试并不复杂,因为KMEANS是硬聚类,一个欧式对象不可能同时出现在两个类别中
源码和我改造后的我都怀疑!您的意思我明白,但是这样做的说服力可以么?有没有什么图形化的界面可以看啊[/quote] 所以说要测试呀,一般都是用已知结果的数据集作为输入,最后看结果。 测试数据可以人为的拉开不同欧式对象的维度差距。 图形展示也是个好办法,但有个问题,当维度小于等于3个的时候,展现还能看看。如果有10个20个维度就看不了了,一个平面空间很难展现那么多维度。 最好找些专业的分析工具来佐证你的代码,比如SPSS、MATLAB[/quote] 谢谢您,我大概有思路了
撸大湿 2013-06-02
  • 打赏
  • 举报
回复
引用 2 楼 jb250170576 的回复:
[quote=引用 1 楼 tntzbzc 的回复:] LZ,你是怀疑源码的准确性?还是怀疑你改造后的程序? 1、如果怀疑源码的准确性,只能靠测试来获得这套源码的聚类的命中率。 很简单,自己生成一批在已知分类数量的多维度数据,跑个50次,看结果。 2、在两个平台上比较测试 KMEANS结果可能会有出入的,这由维度数量和分类数量有关。 但KMEANS测试并不复杂,因为KMEANS是硬聚类,一个欧式对象不可能同时出现在两个类别中
源码和我改造后的我都怀疑!您的意思我明白,但是这样做的说服力可以么?有没有什么图形化的界面可以看啊[/quote] 所以说要测试呀,一般都是用已知结果的数据集作为输入,最后看结果。 测试数据可以人为的拉开不同欧式对象的维度差距。 图形展示也是个好办法,但有个问题,当维度小于等于3个的时候,展现还能看看。如果有10个20个维度就看不了了,一个平面空间很难展现那么多维度。 最好找些专业的分析工具来佐证你的代码,比如SPSS、MATLAB
凌石丶释 2013-05-31
  • 打赏
  • 举报
回复
引用 1 楼 tntzbzc 的回复:
LZ,你是怀疑源码的准确性?还是怀疑你改造后的程序? 1、如果怀疑源码的准确性,只能靠测试来获得这套源码的聚类的命中率。 很简单,自己生成一批在已知分类数量的多维度数据,跑个50次,看结果。 2、在两个平台上比较测试 KMEANS结果可能会有出入的,这由维度数量和分类数量有关。 但KMEANS测试并不复杂,因为KMEANS是硬聚类,一个欧式对象不可能同时出现在两个类别中
源码和我改造后的我都怀疑!您的意思我明白,但是这样做的说服力可以么?有没有什么图形化的界面可以看啊
撸大湿 2013-05-31
  • 打赏
  • 举报
回复
LZ,你是怀疑源码的准确性?还是怀疑你改造后的程序? 1、如果怀疑源码的准确性,只能靠测试来获得这套源码的聚类的命中率。 很简单,自己生成一批在已知分类数量的多维度数据,跑个50次,看结果。 2、在两个平台上比较测试 KMEANS结果可能会有出入的,这由维度数量和分类数量有关。 但KMEANS测试并不复杂,因为KMEANS是硬聚类,一个欧式对象不可能同时出现在两个类别中

33,008

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧