Spark 和 Hadoop 在技术结构上的共同点和区别？

尹桑 2016-06-24 09:52:13

Spark 和 Hadoop 在技术结构上有哪些共同点和区别呢？
本人刚接触这些，不太了解，有大神帮忙解答一下吗

...全文

819 2 打赏收藏转发到动态举报

写回复

用AI写文章

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

SongDongmei 2016-07-11

打赏
举报

引用 1 楼 link0007 的回复:

Hadoop最重要的模块是HDFS分布式文件系统，基本上所有分布式计算框架都架构于它之上。而Spark和Hadoop MR的共同点就是都是Map-Reduce计算框架，不同点是Spark的中间结果放在内存，而Hadoop MR放在HDFS上。所以Spark支持快速迭代运算与近线的流式处理。在编程风格上，Spark更加友好，RDD操作的代码风格非常接近Java8的stream操作，同时DataFrame支持SQL。另外Spark支持的语言有源生的Scala，以及Java，Python，R。

感觉楼上的说法略有不妥。spark的计算框架不是mapreduce。经常有人说Spark就是内存版的MapReduce，实际上不是的。Spark使用的DAG计算模型。

LinkSe7en 2016-06-27

打赏
举报

Hadoop最重要的模块是HDFS分布式文件系统，基本上所有分布式计算框架都架构于它之上。而Spark和Hadoop MR的共同点就是都是Map-Reduce计算框架，不同点是Spark的中间结果放在内存，而Hadoop MR放在HDFS上。所以Spark支持快速迭代运算与近线的流式处理。在编程风格上，Spark更加友好，RDD操作的代码风格非常接近Java8的stream操作，同时DataFrame支持SQL。另外Spark支持的语言有源生的Scala，以及Java，Python，R。