[求助]spark从关系型数据库中读取多个表数据分析成带结构的json问题

zksfxy 2018-03-01 05:34:41
问题需求:公司现有业务数据在传统关系数据库中,目前需要从关系数据库中读出并分析成结构化的Json数据存储起来
目前的做法是先把数据读取出来,保存成临时表,然后通过rdd中的map进行分层处理,每一层需要的数据都到指定的临时表中去拿,写完实验代码,发现行不通呀,只要在下一层中去临时表中查找数据的时候就会卡死,有没有大神给个解决思路呀,谢谢。当前分析代码如下:

控制台最后信息如下:


有没有懂得给讲讲啥情况呗.
...全文
788 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
见丰 2018-03-19
  • 打赏
  • 举报
回复
先把所有的数据读取成dataframe,然后通过filter和join、drop算子得到自己想要的dataframe
LinkSe7en 2018-03-02
  • 打赏
  • 举报
回复
天哪,又是一个在算子里创建SparkSession的

1,258

社区成员

发帖
与我相关
我的任务
社区描述
Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
社区管理员
  • Spark
  • shiter
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧