spark调试好麻烦

球球之家/carver 2017-03-16 10:10:29
我在其他机子上部署了hdfs,hbase,spark,请问我怎么在本地调试java spark来操作远程的hbase,我看网上要么是local本地调试要么是写好打包到远程进行调试,有其他方法吗,就像操作远程数据库一样?求大神解答
...全文
471 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
tchqiq 2017-04-13
  • 打赏
  • 举报
回复
https://sparktutorials.github.io/2015/07/30/spark-testing-unit.html http://mkuthan.github.io/blog/2015/03/01/spark-unit-testing/
小风0092 2017-03-22
  • 打赏
  • 举报
回复
可是尝试使用Phoenix来操作HBase 支持JDBC,支持Spark,支持Spark SQL,均可以本地调试 甚至可以挂载Spring 我们现在HBase生产系统都是基于Apache Phoenix操作的
  • 打赏
  • 举报
回复
1. HBase是一个数据库(分布式), 有自己的JDBC, 你可以根据HBase的JDBC开发自己应用, 只要能连接上, 本地远程都可以 2. Spark集群部署好了, 你写好spark作业, 提交给spark集群, spark cluster计算完成后, 你可以参看结果 3. Spark相关的rest server是livy, 然而并不是很好用有一定的版本和环境要求, 很多开发者会选择避开这个坑, 所以你会看到网上的大部分博客 4. 推荐Linux环境下开发, 少爬很多坑, win不适合大数据相关的开发

1,258

社区成员

发帖
与我相关
我的任务
社区描述
Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
社区管理员
  • Spark
  • shiter
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧