spark跨集群读取数据并计算

eric90g 2019-02-28 04:23:28
有2个hdp集群,hdp1和hdp2,想让spark程序运行在hdp1上,读取hdp2上的数据,大神们有什么方案么?
目前尝试过把hdp2集群的hive-site.xml core-site.xml hdfs-site.xml放到hdp1上的一个spark的conf下,spark-sql可以访问,但是运行spark仅在local模式下可以运行,放在yarn上边,就会报java.net.UnknownHostException: xxxxxx(namenode HA的名字)
...全文
590 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
垃圾的CS DN 2021-03-01
  • 打赏
  • 举报
回复
群主 解决这个问题了么 和你遇到了相同的问题
eric90g 2019-03-01
  • 打赏
  • 举报
回复
引用 1 楼 LinkSe7en 的回复:
你应该是hdp1的集群节点没有hdp2的host信息吧?
host信息都配置过了,local模式是可以运行的,放在yarn上运行就不行了
LinkSe7en 2019-02-28
  • 打赏
  • 举报
回复
你应该是hdp1的集群节点没有hdp2的host信息吧?

1,261

社区成员

发帖
与我相关
我的任务
社区描述
Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
社区管理员
  • Spark
  • shiter
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧