赵强老师:大数据从入门到精通(20)Spark RDD
第一章:Spark RDD
第一节什么是RDD
第二节RDD的算子
第三节RDD基本算子示例
第四节RDD的缓存机制
第五节RDD的容错机制和检查点
第六节RDD的依赖关系和Stage
第二章:RDD的高级算子
第一节mapPartitionsWithIndex
第二节aggregate(1)
第三节aggregate(2)
第四节aggregateByKey
第五节coalesce和repartition
第三章:Spark编程案例
第一节求网站访问量
第二节自定义分区
第三节访问关系型数据库
第四节使用foreachPartition
第五节使用JdbcRDD
赵强老师
毕业于清华大学,拥有超过13年的工作经验。
Oracle认证专家,拥有6年以上授课经验。精通Oracle数据库、中间(Weblogic)和大数据Hadoop的管理和开发,精通Java语言。
曾为湖北移动,北京市公安局,中国人寿,AutoDesk(中国)有限公司,成都运达科技股份有限公司,中国电信,中国移动,山东教育网进行培训。由于其认真负责的授课态度和基于本质的课程内容解释,深受学员的追捧。
相关链接:
https://edu.csdn.net/course/detail/7775?utm_source=edu_bbs_autocreate