云计算异构集群系统存在的问题

wlgjvjsaxnf 2012-05-03 10:23:19
加精
异构集群系统存在的问题

现有的Hadoop调度器都是建立在同构集群的假设前提下,具体假设如下:

1)集群中各个节点的性能完全一样

2)对于reduce task,它的三个阶段:copy、sort和reduce,用时各占1/3

3)同一job的同类型的task是一批一批完成的,他们用时基本一样

实际当中却不然,集群系统需要面对:

1)处理机具有不同计算速度

2)通信能力和存储容量

3)数据局部性问题

如何调和不同处理机计算速度,不同机器之间数据传输问题以及因数据聚集带来I/O传输和网络消耗问题,都是在构架异构集群需要考虑的问题。总之把复杂应用的所有任务合理地调度分配到异构计算系统的各个处理机上, 并追求整个应用的最小完成时间的任务调度问题, 是异构集群计算系统提高性能的一个非常关键的问题。

其中这些问题可以统一理解为,hadoop集群在运行时分配到不同节点上相同计算任务在运行过程当中在开始时间、处理速度、等上存在不一致的情况下,照成有的节点计算起来一下子计算完了,有些任务需要等待很长的时间。总之就是各个节点任务结束不一致,这就要求我们采取方法让任务执行完成基本一致,这就需要我们侦探落后任务。

解决方法:现有的Hadoop调度器存在较大缺陷,主要体现在探测落后任务的算法上:如果一个task的进度落后于同类型task进度的20%,则把该task当做落后任务(这种任务决定了job的完成时间,需尽量缩短它的执行时间),从而为它启动一个备份任务(speculativetask)。如果集群异构的,对于同一个task,即使是在相同节点上的执行时间也会有较大差别,因而在异构集群中很容易产生大量的备份任务。减少过多的备份任务也是需要我们考虑的问题。基于现在情况下存在的问题解决方法可以参考Late调度算法这里就不做深入分析。
原文地址:http://g.csdn.net/5215914
...全文
998 17 打赏 收藏 转发到动态 举报
写回复
用AI写文章
17 条回复
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复
有些道理
xiaoming_nihao 2012-05-07
  • 打赏
  • 举报
回复
不清楚哦
tianshenen 2012-05-06
  • 打赏
  • 举报
回复
很好,谢谢楼主分享
zwc095507 2012-05-06
  • 打赏
  • 举报
回复
又提供了一次学习的机会,谢谢楼主分享
seo2010 2012-05-06
  • 打赏
  • 举报
回复
对这个不太熟
网络服务 2012-05-05
  • 打赏
  • 举报
回复
又提供了一次学习的机会,谢谢楼主分享
and_015 2012-05-04
  • 打赏
  • 举报
回复
异构集群系统存在的问题?好像不太懂!
x86 2012-05-04
  • 打赏
  • 举报
回复
异构的hadoop集群是个麻烦事,最简单的办法就是不要搞成异构,毕竟现在成本不在机器上,尽量将老机器升级上来,或者不用新机器而是多上一些老型号机器。通过配置资源,将不同型号的机器分成多个集群也是一个办法。
lsg_2409 2012-05-03
  • 打赏
  • 举报
回复
受教了,谢谢
enyaggwjth 2012-05-03
  • 打赏
  • 举报
回复
好,但是不太懂

603

社区成员

发帖
与我相关
我的任务
社区描述
异构开发技术
社区管理员
  • OpenCL和异构编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧