spark的缓存问题

mumumuyanyanyan 2017-10-27 09:41:29
问一下,spark中缓存persist或者cache,这两个操作属于transform还是action?
我现在在尝试,读取一个文件,然后将其缓存
val memory = sc.textFile("part-all0").map(x=>(x.split(",")[0],x)).partitionBy(new HashPartitioner(100)).persist()
但是在spark ui中executors中表示内存使用0
如果我在后面加一个action操作
memory.count()
executors中内存就有使用了。

所以我想问一下,这个persist是在什么时候才开始执行的。
...全文
474 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
砍柴大叔 2017-10-30
  • 打赏
  • 举报
回复
persist和cache都是懒执行的,只有遇到action类的算子才会触发执行

1,258

社区成员

发帖
与我相关
我的任务
社区描述
Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
社区管理员
  • Spark
  • shiter
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧