spark 持续运行中executor的内存泄漏问题

BigBangBug 2019-01-17 04:46:01
最近有个任务是持续轮询的将redis的数据写入hdfs,对spark的调用就是简单的一句 spark sql insert table xxxx
spark版本 2.3.2 ,driver(16g) , 7 executor(8g)
但就是这个简单任务发现executor的内存不断上升(driver不会,rss已到5G),但看jvm却一点问题没有,以下是通过vjtools的vjtop监控截屏,初步怀疑是Netty的堆外内存导致的,但不知要如何设置才能避免这种问题?


运行一天,内存不断上升,swap也开始使用了,等swap用完估计executor就会dead了


...全文
437 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
Moody丶 2021-08-15
  • 打赏
  • 举报
回复

卧槽,我也是,sparkstreaming进程dump下来的日志越来越大,运行一天后直接崩溃。。。只能靠脚本重启

xxbb339 2019-04-25
  • 打赏
  • 举报
回复
(1)持续轮询是无限死循环?? 还是外部调度spark程序? 读取很快,写入比较慢,或者文件多而小,导致拥堵,一直堆积,内存持续上升,去观察观察spark的stage.
夕阳不近人 2019-01-18
  • 打赏
  • 举报
回复
我也碰到过,没解决,只能写个脚本每天半夜重启一次,等大牛解答。

1,261

社区成员

发帖
与我相关
我的任务
社区描述
Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
社区管理员
  • Spark
  • shiter
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧