问下,我在eclipse执行spark程序程序执行到shuffle卡住了怎么办?

shiyuexx 2020-07-03 09:58:43
问下,我在eclipse执行spark程序程序执行到shuffle卡住了怎么办?
...全文
78 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
咕泡-星云 2021-07-12
  • 打赏
  • 举报
回复

以下内容供参考:
1.部分task执行慢,是由于shuffle性能影响,调整shuffle参数规避。

spark.shuffle.file.buffer=64k
spark.reducer.maxSizeInFlight=96M
spark.network.timeout=300s
spark.rpc.askTimeout=300s
spark.shuffle.io.serverThreads=8

2.不排除网络问题的影响,试图调整os参数,但是客户生产

net.ipv4.tcp_keepalive_time= 15
net.ipv4.tcp_keepalive_probes = 10
net.ipv4.tcp_keepalive_intvl= 30

3.关闭sasl

spark.authenticate.enableSaslEncryption=false
spark.authenticate=false

1,258

社区成员

发帖
与我相关
我的任务
社区描述
Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
社区管理员
  • Spark
  • shiter
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧