社区
徐培成的课程社区_NO_1
2019年经典hadoop体系课程
帖子详情
Hadoop第15天-05.join-reduce端连接2
十八掌教育
2023-01-12 22:38:36
课时名称
课时知识点
Hadoop第15天-05.join-reduce端连接2
...全文
157
回复
打赏
收藏
Hadoop第15天-05.join-reduce端连接2
课时名称课时知识点Hadoop第15天-05.join-reduce端连接2
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
大数据第一季--
Hadoop
(day
15
)-徐培成-专题视频课程
大数据第一季--
Hadoop
(day
15
)
05
Map
Reduce
增强
文章目录
05
Map
Reduce
增强1、Map
Reduce
的分区与
reduce
Task的数量2、Map
Reduce
排序以及序列化
05
Map
Reduce
增强 1、Map
Reduce
的分区与
reduce
Task的数量 map
reduce
当中的分区:物以类聚,人以群分,相同key的数据,去往同一个
reduce
reduce
task的数量通过我们自己手动指定 job.setNum
Reduce
Ta...
HiveDay
05
去重 连续登陆问题 设备异常需求
Hive 调优
摘要:hive调优
Hive调优
执行分组操作, 翻译后的MR, 分组的字段就是k2的字段, 按照k2进行分组操作, 将相同value合并在同一个集合中, 既然分组的字段就是MR的k2, 那么分区也会按照分组字段进行分区操作, 如果某个组下数据非常的多, 可能出现出现什么问题呢?查询满足条件的一整行数据的时候,列存储则需要去每个聚集的字段找到对应的每个列的值,行存储只需要找到其中一个值,其余的值都在相邻地方,所以此时行存储查询的速度更快。每个字段的数据类型一定是相同的,列式存储可以针对性的设计更好的设计压缩算法。
徐培成的课程社区_NO_1
1
社区成员
469
社区内容
发帖
与我相关
我的任务
徐培成的课程社区_NO_1
复制链接
扫一扫
分享
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章