如何把RDD转换成可以广播的变量

林重言 2015-08-03 10:54:40
我把 SparkContext instance 转成RDD 经过处理得到想要的中间数据, 而这中间数据需要被各节点共享,我该如何操作,才能把它广播出去? 详细点说是,我们根据log文件读取出所有被冻结的账户,而这些被冻结的账户需要被共享,这样的话好进行判断。

谢谢各位,小弟初入门庭,还望大家不吝指导。
...全文
383 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复
sc.broadcast
wingerliwei 2015-08-31
  • 打赏
  • 举报
回复
就看你各个机器是想怎么用这个数据,比如可以把他输出到HDFS中,这样每个机器再从HDFS里读取就行了。还是需要具体看你怎么用数据

1,258

社区成员

发帖
与我相关
我的任务
社区描述
Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
社区管理员
  • Spark
  • shiter
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧