Apriori算法中的候选k项集的产生的方法称为连接步,为什么这个连接步就可以产生所有可能的候选k项集呢?
小白么么哒 2015-12-18 09:15:01 连接步:为找出Lk,通过将Lk-1与自身连接产生候选k-项集的集合。
该候选项集的记作Ck。设l1和l2是项集Lk-1中的项集,li[j]表示li的第j项。Apriori算法中假定事务或者项集中的项按字典序排序。对于(k-1)项集li,这意味着li[1]<li[2]<…<li[k-1]。执行连接操作,其中Lk-1的元素是可连接的,如果他们前(k-2)个项相同。即,Lk-1的元素l1和l2是可连接的,如果(l1[1]= l2[1])∧(l1[2]= l2[2])∧…∧(l1[k-2]= l2[k-2])∧(l1[k-1]< l2[k-1])。l1和l2连接的结果项集是{l1[1],l1[2],…,l1[k-2],l1[k-1],l2[k-1]}。
我就是突然不明白了,为什么与自身连接就可以产生候选项集了呢,哪位同学可以用数学的思想证明一下,感激不尽。