通过一个实例,我使用Apriori和FP-Growth两个算法分别求一个事务T的频繁项集,但其中有一个频繁项集的支持度计数FP-Growth与Apriori得出的结论不一样。但也很显然是FP-Growth得出的结果不对,但我不知道计算过程哪一步出了问题,请大家帮我分析一下。
对于下表所示的事务集合,设最小支持度计数为2,采用FP-Growth算法求所有的频繁项集:
我通过FP-Growth算法计算求出:
①e3的条件模式基为:{e2, e1}:1、{e2}:2、{e1}:2
②e3的条件FP树为:{e2:3}、{e1:2}
③e3的频繁项集为:{e2, e3}:3、{e1, e3}:2
问题出现在频繁项集{e1, e3}:2上面,通过观察上面的事务集合,频繁项集{e1, e3}的支持度计数应该为3,我使用Apriori计算后,该频繁项集的支持度计数也是3。但为何使用FP-Growth计算出来的是2呢?不明白问题出在什么地方了。还请大家帮忙分析给一下。我的计算过程如下(大家只看e3的计算过程即可):