怎么开发一个基于spark的web实时查询web程序

Kevin-tao 2015-02-04 09:28:53
如标题,公司想开发这样一个小程序,但是现在不知道从何下手,spark又没有提供接口可以在我的web应用程序里面直接调用,那意味着是不是我每次查询的时候,要把sql语句和对应的scala代码一起通过ssh提交到集群的主机上运行spark-shell命令,但是有几个地方想不明白

1.这样执行的结果我怎么拿回来显示在web界面上?还是有其他的办法实现?
2.我们有个功能点是机器学习所以会用到MLLib,每个流程点都需要提交查询一次,把结果拿一部分回来给用户看,并把结果作为下个流程节点的输入,那我的web程序怎么和集群沟通
...全文
5520 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
q1984201234 2017-03-31
  • 打赏
  • 举报
回复
楼主 我这边搞了一下,可以搞,试试 akka-http
荒野雄兵 2017-03-30
  • 打赏
  • 举报
回复
楼主是怎么解决的?公司也遇到同样的问题,网上都说可以打开Spark的thrift-server端口,但是CDH版的SPark根本就没有启动thrift-server的文件
qq_35969898 2016-08-26
  • 打赏
  • 举报
回复
话说不需要吧,spark不是提供java的api吗,直接在web后台引入spark的包然后调用api就能提交东西吧 如果东西多本地放不下,在hdfs上的话,也可以调用得到的,没必要非得打成包。我说的不是本地模式,是吧本地也看成是一个节点,虽然没干过,不过本地压力应该不小。
kenneth 2016-08-17
  • 打赏
  • 举报
回复
http://blog.csdn.net/linchunhua/article/details/52228730
LinkSe7en 2016-03-15
  • 打赏
  • 举报
回复
把web端的请求写入kafka,Spark 读取kafka数据处理将后写入缓存数据库。
JQjiang54 2016-03-09
  • 打赏
  • 举报
回复
楼主怎么弄得,能分享一下吗
sdboy206206 2015-10-26
  • 打赏
  • 举报
回复
参考一下apache的开源项目: apache lens
通凡 2015-10-20
  • 打赏
  • 举报
回复
楼主的问题是怎么解决的,我们现在也要这样来做,要怎么进行 ,能不能给小弟一点指导

1,258

社区成员

发帖
与我相关
我的任务
社区描述
Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
社区管理员
  • Spark
  • shiter
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧