sparkstreaming为什么读取空数据运行特别慢

迷途1503 2018-07-24 05:11:48
sparkstreaming+kafka模型,刚启动时是没有数据传进去的,map->reduceBykey->foreachRDD,foreachRDD中对rdd是否为空做了判断,sparkui界面查看stage居然是map耗时最长,这是为什么?各位大神求解答
...全文
207 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

1,261

社区成员

发帖
与我相关
我的任务
社区描述
Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
社区管理员
  • Spark
  • shiter
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧