关于JAVA和SPARK结合的困惑...

Evolintion 2018-03-28 05:32:47
在下是个初级JAVA,目前接手了一个任务做一个数据加工系统。拿一个连锁超市举例子,这个超市的老板通过我们的系统上传小票文件,然后我们根据文件中每一条小票上的店名,销售人员和商品信息,给这个超市老板出一个报表,比如说店销售额排名,人员销售额排名等等。但是可能文件很大,没办法一次性读到内存里计算,希望借助Spark来实现...在这里有一个困惑,就是如何使用JAVA自动将这个计算任务交给Spark并获取到结果...
...全文
591 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
shiter 2018-03-31
  • 打赏
  • 举报
回复
打个jar包扔上去跑?
LinkSe7en 2018-03-29
  • 打赏
  • 举报
回复
我看你是个定时出报表的需求吧?那直接用Java写个Spark的Application,用cron定时跑就是了

20,808

社区成员

发帖
与我相关
我的任务
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
  • 分布式计算/Hadoop社区
  • 涤生大数据
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧