集合算法求助:识别经常在一起出现的人群

dragonzht 2013-06-03 09:40:31
总共有3000个人,每周末都参加集体活动,每个人都根据兴趣选择参加哪个活动,也有一点随机性。
已知每周都有10~20个活动,活动形式是不固定的,每个人都参加一项活动,而且每周只参加一项。
已知每周哪些人在一起参加活动,即参加同一项活动,但不知道每个人参加的具体活动形式。
统计了一年52周的信息。
要根据统计的信息对3000个人进行分类,分类原则:如果两个人经常一起参加活动,那么就分在同一类。
目标是将3000个人分成10类。

如果用一个矩阵统计两个人一起参加活动的次数,需要3000*3000字节的内存,约8.6MByte,有点大。人数再增加时就吃不消了。

有没有牺牲一点准确性,减少内存占用,而且快速的算法呢?
...全文
422 点赞 收藏 2
写回复
2 条回复
cfvmario 2013年08月05日
关联数据挖掘问题吧。可以增量算的
回复 点赞
帖子不能编辑 2013年06月07日
你可以换一种表达方法阿。 用一个二维数组,第一维表示活动,第二位表示人。 int info[20][3000]; 也就是几百k内存。
回复 点赞
发动态
发帖子
数据结构与算法
创建于2007-08-27

3.0w+

社区成员

3.4w+

社区内容

数据结构与算法相关内容讨论专区
社区公告
暂无公告