spark怎么开发任务方便

y1006597541 2019-01-29 04:06:40

请教一下大家spark任务都是怎么开发的，现在我是在本地写好任务然后放到集群上测试的，这样子开发速度慢，请教一下大家在开发的时候都用什么手段。
问题一：大家怎么开发spark任务，比如记得有些人提过在大数据集群内网安装ubuntu系统，在上面安装idea；或者idea远程连接大数据集群开发？
问题二：spark-streaming该怎么开发方便，spark任务还能在spark shell里面一步步来，spark-streaming不能debug吗？

...全文

259 2 打赏收藏转发到动态举报

写回复

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

伟大的一校之长 2019-02-25

打赏
举报

回复

不知道你所谓的方便是指什么意思,只是单纯说代码变少了,还是说开发起来更简单,如果说开发的话还是在Linux上面最方便,我现在是在ubuntu系统上装了一个idea开发

西門吹牛__Linux 2019-02-23

打赏
举报

回复

Spark任务快速开发的话，Zeppelin了解一下，持久化的SparkContext，直接敲代码运行。

spark-shell 实现了用户可以逐行输入代码，进行操作的功能。即可以不像Java一样，编写完所有代码，然后编译才能运行。spark-shell 支持。交互环境和 python交互环境，在学习测试中可以使用...会启动一个spark任务。

spark提交代码的两种方式：Standalone、Yarn。

这篇文章主要向大家介绍使用azkaban调度spark任务,主要内容包括基础应用、实用技巧、原理机制等方面，希望对大家有所帮助。 Azkaban是一种相似于Oozie的工作流控制引擎，能够用来解决多个Hadoop（或Spark等）离线...

通过Spark Web界面，用户可以实时查看Spark应用程序的运行状态、作业执行情况、任务调度情况等重要信息，帮助用户更好地监控和...Spark提供了一个Web界面，可以方便地查看正在运行的Spark应用程序和任务的详细信息。

Spark是一个快速、通用、可...Spark支持多种编程语言，包括Java、Scala、Python和R等，同时也提供了丰富的API和工具，如Spark SQL、Spark Streaming、MLlib和GraphX等，方便开发人员进行数据处理和分析。Spark的优势。

Hadoop生态社区

20,808

社区成员

4,690

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章