20,808
社区成员
发帖
与我相关
我的任务
分享
目录
- MapReduce编程实例
- 1.自定义对象序列化
- 2.数据去重
- 3.数据排序、二次排序
- 4.自定义分区
- 5.计算出每组订单中金额最大的记录
- 多文件输入输出、及不同输入输出格式化类型
- 6.合并多个小文件
- 7.分组输出到多个文件
- 8.join操作
- 9.计算出用户间的共同好友
- MapReduce理论基础
- Hadoop、Spark学习路线及资源收纳
- MapReduce实战系统学习流程
- 词频统计
- 数据去重
- 数据排序
- 求平均值、中位数、标准差、最大/小值、计数
- 分组、分区
- 数据输入输出格式化
- 多文件输入、输出
- 多文件输入、输出
- 单表关联
- 多表关联
- 倒排索引
- TopN
- PeopleRank算法实现
- 推荐系统——协同过滤算法实现
- 数据
- 关于我