请教大家一个关于FP-Growth算法的问题。

sunchun0412 2018-06-28 05:28:15
通过一个实例,我使用Apriori和FP-Growth两个算法分别求一个事务T的频繁项集,但其中有一个频繁项集的支持度计数FP-Growth与Apriori得出的结论不一样。但也很显然是FP-Growth得出的结果不对,但我不知道计算过程哪一步出了问题,请大家帮我分析一下。

对于下表所示的事务集合,设最小支持度计数为2,采用FP-Growth算法求所有的频繁项集:


我通过FP-Growth算法计算求出:
①e3的条件模式基为:{e2, e1}:1、{e2}:2、{e1}:2
②e3的条件FP树为:{e2:3}、{e1:2}
③e3的频繁项集为:{e2, e3}:3、{e1, e3}:2

问题出现在频繁项集{e1, e3}:2上面,通过观察上面的事务集合,频繁项集{e1, e3}的支持度计数应该为3,我使用Apriori计算后,该频繁项集的支持度计数也是3。但为何使用FP-Growth计算出来的是2呢?不明白问题出在什么地方了。还请大家帮忙分析给一下。我的计算过程如下(大家只看e3的计算过程即可):



...全文
414 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

33,006

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧