数据挖掘中的Apriori算法

fly_leaf 2013-04-16 11:46:16
相信学习过数据挖掘的同学都知道Apriori算法吧,按照算法思想,我已经用Java将其实现了。但现在有个问题,就是算法的证明。在产生频繁K项集的候选项集的时候,每次都是将频繁K-1项集中的相差一个属性两个项集进行连接,为什么不能用其他的有更多不同属性的项集连接。
比如说书上有个例子C3=L2&L3={(I1,I2),(I1,I3),(I1,I5),(I2,I3),(I2,I4),(I2,I5)}
&{(I1,I2),(I1,I3),(I1,I5),(I2,I3),(I2,I4),(I2,I5)}
={(I1,I2,I3),(I1,I2,I5),(I1,I3,I5),(I2,I3,I4),(I2,I3,I5),(I2,I4,I5)}

产生的候选项集中就没有(I1,I2,I4)和(I1,I4,I5)。
请教各位高手
...全文
177 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
fly_leaf 2013-05-27
  • 打赏
  • 举报
回复
引用 2 楼 ls03101409 的回复:
感觉应该有(l1,l2,l4)吧,可以用(l1,l2)和(l2,l4)构造成,不过(l1,l4,l5)应该没有。 LZ问题的意思是在多余一个不同项的项集间进行链接吗?那样两个K-1项集连接产生的就不是K项集了,比如(A,B,C)和(A,B,D)可以连接产生(A,B,C,D)但(A,B,C)和(A,D,E)就会产生(A,B,C,D,E)了,也就是两个3-项集产生了一个5-项集,这样构造的话会产生更多的候选项集,而这些候选项集大多都不是要找的频繁项集,会进行更多无谓的计算。我也是新手,不知道说的是不是LZ想问的
(A,B,C)和(A,D,E)连接也会产生(A,B,C,D)和(A,B,D,E)等等,请问项集之间是通过什么方式连接的呢
ls03101409 2013-04-26
  • 打赏
  • 举报
回复
感觉应该有(l1,l2,l4)吧,可以用(l1,l2)和(l2,l4)构造成,不过(l1,l4,l5)应该没有。 LZ问题的意思是在多余一个不同项的项集间进行链接吗?那样两个K-1项集连接产生的就不是K项集了,比如(A,B,C)和(A,B,D)可以连接产生(A,B,C,D)但(A,B,C)和(A,D,E)就会产生(A,B,C,D,E)了,也就是两个3-项集产生了一个5-项集,这样构造的话会产生更多的候选项集,而这些候选项集大多都不是要找的频繁项集,会进行更多无谓的计算。我也是新手,不知道说的是不是LZ想问的
pxhubu 2013-04-21
  • 打赏
  • 举报
回复
楼主可否联系我。QQ: 1三708四612

2,209

社区成员

发帖
与我相关
我的任务
社区描述
其他数据库开发 其他数据库
社区管理员
  • 其他数据库社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧