社区
Power Linux
帖子详情
implala和spark怎样协作呢?
钱奋(主持人)
2016-06-20 10:08:05
implala和spark怎样协作呢? 有哪位大神了解这些,能讲解一下吗?感谢感谢
...全文
1020
2
打赏
收藏
implala和spark怎样协作呢?
implala和spark怎样协作呢? 有哪位大神了解这些,能讲解一下吗?感谢感谢
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
2 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
SongDongmei
2016-07-11
打赏
举报
回复
impala用的mpp,这点跟ibm biginsight里的bigsql比较像,bigsql是借鉴了db2的mpp。他们跟spark不是一个路子。
chyanch
2016-06-21
打赏
举报
回复
Impala是像Dremel一样借鉴了MPP并行数据库的思想另起炉灶,因此可做更多的查询优化,从而省掉不必要的shuffle、sort等开销。而且Cloudera称并不会使用Spark替换Impala,他们坚信Impala将是交互式SQL on Hadoop查询的未来。所以Impala和Spark其实2套体系。
大数据
Spark
实战视频教程
大数据
Spark
实战视频培训教程:本课程内容涉及,
Spark
虚拟机安装、
Spark
表配置、平台搭建、快学Scala入门、
Spark
集群通信、任务调度、持久化等实战内容。
Spark
是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室...
HADOOP和
spark
的关系?
spark
能否替代Hadoop???
1. HADOOP和
spark
的关系? 如下图所示: Hadoop和
Spark
两者都是大数据框架,但是各自存在的目的不尽相同。Hadoop实质上更多是一个分布式数据基础设施: 它将巨大的数据集分派到一个由普通计算机组成的集群中的多个...
学
Spark
需要什么基础?
首先,学习大数据,不管是Hadoop还是
Spark
,基本功都少不了Linux和Java。搭建集群环境,Linux基础是必须的,系统操作命令是基础中的基础。而Java,主要以JavaSE的知识为重点,包括面向对象、集合、io、多线程以及...
spark
是什么?
spark
和MapReduce的区别?
spark
为什么比hive速度快?
spark
和hive的区别? 1.
spark
的job输出结果可保存在内存中,而MapReduce的job输出结果只能保存在磁盘中,io读取速度要比内存中慢; 2.
spark
以线程方式运行,MapReduce以进程的方式运行,进程要比线程耗费时间和...
大数据开发:
spark
是否依赖Hadoop?
但是仅在一年多左右的时间,
Spark
就迅速成为了新一代的大数据框架的选择,光环甚至一度超过Hadoop,而关于Hadoop和
Spark
的争议,也一直没断过。比如说
Spark
是否依赖hadoop? 关于
Spark
和Hadoop的关系,一开始似乎是...
Power Linux
742
社区成员
901
社区内容
发帖
与我相关
我的任务
Power Linux
该论坛主要探讨Linux系统在IBM Power平台的安装、部署、应用开发等话题,并为网友们提供自由交流的平台。
复制链接
扫一扫
分享
社区描述
该论坛主要探讨Linux系统在IBM Power平台的安装、部署、应用开发等话题,并为网友们提供自由交流的平台。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章