社区
Power Linux
帖子详情
Spark稳定性怎么样?
程序咖要少喝
2016-06-12 05:02:30
Spark稳定性怎么样?有的人说在长任务中容易出问题,是吗??
...全文
764
3
打赏
收藏
Spark稳定性怎么样?
Spark稳定性怎么样?有的人说在长任务中容易出问题,是吗??
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
dingybin
2016-06-14
打赏
举报
回复
Spark是小数据集上处理复杂迭代的交互系统,每次迭代的数据可以保存在内存中,而不是写入文件,数通过在内存中缓存数据,提高迭代式计算的性能。Spark并不擅长大数据集,稳定性也相对差一些。 处理大规模数据而言,Hadoop MapReduce更擅长一些,MapReduce存盘的好处是允许继续在失败的数据上继续跑,所以直观上说MapReduce作为引擎更稳健。但理论上来说,如果选择在每个完成的小步骤上加CheckPoint,那Spark完全能和现在的MapReduce达到一样的稳健。
dingybin
2016-06-14
打赏
举报
回复
可以参考一下链接: Spark编程指南——Python版 http://www.csdn.net/article/2015-04-24/2824552
alinly
2016-06-13
打赏
举报
回复
我使用了,没有遇到spark自己的问题, 要么是程序有问题.
大数据
Spark
实战视频教程
大数据
Spark
实战视频培训教程:本课程内容涉及,
Spark
虚拟机安装、
Spark
表配置、平台搭建、快学Scala入门、
Spark
集群通信、任务调度、持久化等实战内容。
Spark
是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室...
为什么说
spark
不稳定
稳定性
方面,由于代码质量问题,
Spark
长时间运行会经常出错,在架构方面,由于大量数据被缓存在内存中,Java垃圾回收缓慢的现象严重,导致
Spark
的性能不稳定,在复杂场景SQL的性能甚至不如现有的Map/Reduce。...
带你深入浅出,彻底了解什么是
Spark
?
大数据专业,或者人工智能,深度学习方向的小伙伴们一定对
Spark
这个名词不陌生吧~不认识也没有关系,今天Alice为大家带来关于
Spark
的一个详细介绍。 文章目录激动人心的
Spark
发展史
Spark
为什么流行?1:优秀的数据...
为什么
Spark
比MapReduce快
- 为什么
Spark
比MapReduce快?...
Spark
的设计:数据在内存中进行交换,要快一些,但是内存这个东西,可靠性不如磁盘。所以性能方面比MapReduce要好。 DAG计算模型在迭代计算上还是比MapReduce的效率更高 有向无环...
大数据之
Spark
:
Spark
大厂面试真题
通常来说,
Spark
与MapReduce相比,
Spark
运行效率更高。请说明效率更高来源于
Spark
内置的哪些机制?2. hadoop和
spark
使用场景?3.
spark
如何保证宕机迅速恢复?4. hadoop和
spark
的相同点和不同点?5. RDD持久化原理?...
Power Linux
742
社区成员
901
社区内容
发帖
与我相关
我的任务
Power Linux
该论坛主要探讨Linux系统在IBM Power平台的安装、部署、应用开发等话题,并为网友们提供自由交流的平台。
复制链接
扫一扫
分享
社区描述
该论坛主要探讨Linux系统在IBM Power平台的安装、部署、应用开发等话题,并为网友们提供自由交流的平台。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章