Spark 和 Hadoop 在技术结构上的共同点和区别?

尹桑 2016-06-24 09:52:13
Spark 和 Hadoop 在技术结构上有哪些共同点和区别呢?
本人刚接触这些,不太了解,有大神帮忙解答一下吗
...全文
819 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
SongDongmei 2016-07-11
  • 打赏
  • 举报
回复
引用 1 楼 link0007 的回复:
Hadoop最重要的模块是HDFS分布式文件系统,基本上所有分布式计算框架都架构于它之上。 而Spark和Hadoop MR的共同点就是都是Map-Reduce计算框架,不同点是Spark的中间结果放在内存,而Hadoop MR放在HDFS上。所以Spark支持快速迭代运算与近线的流式处理。在编程风格上,Spark更加友好,RDD操作的代码风格非常接近Java8的stream操作,同时DataFrame支持SQL。另外Spark支持的语言有源生的Scala,以及Java,Python,R。
感觉楼上的说法略有不妥。spark的计算框架不是mapreduce。经常有人说Spark就是内存版的MapReduce,实际上不是的。Spark使用的DAG计算模型。
LinkSe7en 2016-06-27
  • 打赏
  • 举报
回复
Hadoop最重要的模块是HDFS分布式文件系统,基本上所有分布式计算框架都架构于它之上。 而Spark和Hadoop MR的共同点就是都是Map-Reduce计算框架,不同点是Spark的中间结果放在内存,而Hadoop MR放在HDFS上。所以Spark支持快速迭代运算与近线的流式处理。在编程风格上,Spark更加友好,RDD操作的代码风格非常接近Java8的stream操作,同时DataFrame支持SQL。另外Spark支持的语言有源生的Scala,以及Java,Python,R。

742

社区成员

发帖
与我相关
我的任务
社区描述
该论坛主要探讨Linux系统在IBM Power平台的安装、部署、应用开发等话题,并为网友们提供自由交流的平台。
社区管理员
  • Power Linux社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧