基于spark实现大表join效率优化效果好吗?能实现毫秒级join吗

一路向上upup 2016-09-13 04:55:26
基于spark实现大表join效率优化效果好吗?能实现毫秒级join吗 ? 谢谢解答!
...全文
2394 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
oO眸眸Oo 2016-11-17
  • 打赏
  • 举报
回复
目前来说,是不太可能,将来技术设备更新,有可能。
LinkSe7en 2016-09-14
  • 打赏
  • 举报
回复
如果join的条件是xxx=yyy,则非常快,具体视乎集群规模和数据规模;如果是表达式或不等式,相当于Mysql的全表扫描,而且会有节点间数据交换、调度延迟等因素,相对比较慢

742

社区成员

发帖
与我相关
我的任务
社区描述
该论坛主要探讨Linux系统在IBM Power平台的安装、部署、应用开发等话题,并为网友们提供自由交流的平台。
社区管理员
  • Power Linux社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧