请教大家一个关于FP-Growth算法的问题。

sunchun0412 2018-06-28 05:28:15
通过一个实例,我使用Apriori和FP-Growth两个算法分别求一个事务T的频繁项集,但其中有一个频繁项集的支持度计数FP-Growth与Apriori得出的结论不一样。但也很显然是FP-Growth得出的结果不对,但我不知道计算过程哪一步出了问题,请大家帮我分析一下。

对于下表所示的事务集合,设最小支持度计数为2,采用FP-Growth算法求所有的频繁项集:


我通过FP-Growth算法计算求出:
①e3的条件模式基为:{e2, e1}:1、{e2}:2、{e1}:2
②e3的条件FP树为:{e2:3}、{e1:2}
③e3的频繁项集为:{e2, e3}:3、{e1, e3}:2

问题出现在频繁项集{e1, e3}:2上面,通过观察上面的事务集合,频繁项集{e1, e3}的支持度计数应该为3,我使用Apriori计算后,该频繁项集的支持度计数也是3。但为何使用FP-Growth计算出来的是2呢?不明白问题出在什么地方了。还请大家帮忙分析给一下。我的计算过程如下(大家只看e3的计算过程即可):



...全文
302 点赞 收藏 回复
写回复
回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
相关推荐
发帖
数据结构与算法
创建于2007-08-27

3.2w+

社区成员

数据结构与算法相关内容讨论专区
申请成为版主
帖子事件
创建了帖子
2018-06-28 05:28
社区公告
暂无公告