数据挖掘中的Apriori算法
相信学习过数据挖掘的同学都知道Apriori算法吧,按照算法思想,我已经用Java将其实现了。但现在有个问题,就是算法的证明。在产生频繁K项集的候选项集的时候,每次都是将频繁K-1项集中的相差一个属性两个项集进行连接,为什么不能用其他的有更多不同属性的项集连接。
比如说书上有个例子C3=L2&L3={(I1,I2),(I1,I3),(I1,I5),(I2,I3),(I2,I4),(I2,I5)}
&{(I1,I2),(I1,I3),(I1,I5),(I2,I3),(I2,I4),(I2,I5)}
={(I1,I2,I3),(I1,I2,I5),(I1,I3,I5),(I2,I3,I4),(I2,I3,I5),(I2,I4,I5)}
产生的候选项集中就没有(I1,I2,I4)和(I1,I4,I5)。
请教各位高手