请教hive中使用开窗函数sum聚合时候执行很慢如何优化

学习路上的小乌龟 2020-05-04 06:33:45
在oracle使用开窗函数跑25万数据量只需要3秒,hive执行时候reduce无限多,完全执行不动!尝试执行同样逻辑的两万以内数据一分钟就可以跑完,数据量大了完全执行不动!有没有遇到过这种问题的大佬们!
...全文
1089 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
後弛 2021-05-13
  • 打赏
  • 举报
回复
可以用hive on spark处理数据,不走mapreduce就快很多了
  • 打赏
  • 举报
回复
大佬们急救

7,388

社区成员

发帖
与我相关
我的任务
社区描述
其他数据库开发 数据仓库
社区管理员
  • 数据仓库
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧