求助大神!!!
实验内容:
应用 Python进行关联分析,包括对频繁数据集的探索、关联规则的建立和结果的分析。
对于数据集Income,使用 Apriori算法建立关联规则。
实验步骤:
1)获取数据集 Income,查看数据集 Income的前五个事项,了解数据集的项集以及具体内容。
2)查看 Income中各个项的支持度,并单独查看项“age=14-34”和项“sex=male”的支持度,查看支持度最大的前10个项。
3)以最小支持度为0.1,最小置信度为0.5建立 Apriori关联规则,得到的关联规则记为 rule1;以最小支持度为0.1,最小置信度为0.6建立 Apriori关联规则,得到的关联规则记为rule2;以最小支持度为0.2,最小置信度为0。5建立 Apriori关联规则,得到的关联规则记为rule3。比较三个关联规则的数目。