CSDN在线培训:大数据环境下的关联规则挖掘 QA贴
报名链接:http://g.csdn.net/5267274
【课程时间】:2014年4月3日(周四) 20:50 - 22:00
【课程安排】:20:50—21:00 通过邮件地址登录网络课堂
21:00—22:00 主题演讲(赵修湘)与QA
PS:课程咨询请加入QQ群:CSDN云计算群(107114534)
【温馨提示】: 在线视频直播互动,采用三分屏模式,让您感受真实的课堂环境。本次会议机会难得,由于报名人员较多,将对申请参会者进行资格审核,请您务必填写个人信息以便通知(短信、邮件)及时送达,保证您的顺利参会。邮件和短信提醒将会在课程前一天发出,请注意查收!具体时间以邮件通知为准!
课程介绍:大数据环境下的关联规则挖掘
课程大纲:
1)mapred计算框架简介
2)关联规则挖掘简介
2.1)关联规则挖掘的目的
2.2)经典算法回归:apriori 和 fpg
3)大数据环境下关联规则挖掘面临的挑战
3.1)时间挑战:当数据量增长到一定程度时,单机挖掘所需求的时间增长到无法忍受
3.2)空间挑战:当数据量增长到一定程度时,单机的内存无法全部保存所发现的模式
4)大数据关联规则:解决方案1-暴力法
4.1)直接依靠mapred的强大计算能力暴力求解问题
5)大数据关联规则:解决方案2-mr Apriori
5.1)暴力法还是会遇上时间和空间约束的挑战
5.2)Apriori算法的mapred实现
5.2.1)Apriori算法的mapred实现:如何生成新的候选集
5.2.2)Apriori算法的mapred实现:如何保存的候选集
PS:大家有问题可以回帖留言。我会整理后让讲师统一回答的。