集合算法求助:识别经常在一起出现的人群

dragonzht 2013-06-03 09:40:31
总共有3000个人,每周末都参加集体活动,每个人都根据兴趣选择参加哪个活动,也有一点随机性。
已知每周都有10~20个活动,活动形式是不固定的,每个人都参加一项活动,而且每周只参加一项。
已知每周哪些人在一起参加活动,即参加同一项活动,但不知道每个人参加的具体活动形式。
统计了一年52周的信息。
要根据统计的信息对3000个人进行分类,分类原则:如果两个人经常一起参加活动,那么就分在同一类。
目标是将3000个人分成10类。

如果用一个矩阵统计两个人一起参加活动的次数,需要3000*3000字节的内存,约8.6MByte,有点大。人数再增加时就吃不消了。

有没有牺牲一点准确性,减少内存占用,而且快速的算法呢?
...全文
514 2 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
cfvmario 2013-08-05
  • 打赏
  • 举报
回复
关联数据挖掘问题吧。可以增量算的
帖子不能编辑 2013-06-07
  • 打赏
  • 举报
回复
你可以换一种表达方法阿。 用一个二维数组,第一维表示活动,第二位表示人。 int info[20][3000]; 也就是几百k内存。

33,027

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧