标准化互信息Normalized Mutual Information(NMI) 检测社区发现效果
关于互信息的相关可以参考http://www.cnblogs.com/ziqiao/archive/2011/12/13/2286273.html
当然,懂的大神不需要靠这个也行...
菜鸟最近在做社区发现的相关项目,目前项目已进入最后的测试阶段。现在需要利用这个NMI来评价社区发现的结果,不知是否有大神做过类似的工作。
换句话说,现在我有两个文档,一个里面分别存放的是标准的社区分布,另外一个里面存放的是我的算法运行出来的社区分布。文档里面的格式如下:txt1为标准社区分布,txt2为我的社区分布
txt1: txt2:
5 3 1 4 7 1 2 8
2 8 6 9 10
6 9 10 5 3 4 7
每一行代表着一个社区,社区的上下顺序对NMI测量结果应没有影响
现在需要任意一种语言实现的NMI测量程序,帮助我检测许多个数据集的社区发现结果。大的数据集有可能有几万个社区,所以对文档的预处理会比较麻烦,最好可以在NMI程序中得到实现。
求大神帮助,感激不尽!