mapReduce优势在哪

justdo_ 2017-06-01 08:25:34
我是hadoop方面的新手,近期我想使用mapreduce来实现pageRank搜索算法(数据量大概在4G左右),关于算法的流程我是知晓的,我想知道我自己写java程序来模拟mapreduce和直接套用hadoop的mapreduce来实现有何区别,因为感觉hadoop的mapreduce使用了很多的变量及类,反而变得复杂了,我想知道hadoop的优势何在?
...全文
2050 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
且听_风吟 2018-01-23
  • 打赏
  • 举报
回复
分布式处理,现在不明显,在已经发布的3.0版本中,MR处理速度大大提升。 大数据面试知识点分析专栏
dinghun8leech 2017-12-01
  • 打赏
  • 举报
回复
hadoop谈不上啥优势吧,只是那几篇大佬的论文、构想的第一个实现,做到了从0到1的突破,mr组件众多,从job提交,到切片,到map,到中间落地,到混洗,到reduce,到最终输出,东西确实多,落地次数又多,业界早就考虑用新技术替代它。
mlj0381 2017-09-15
  • 打赏
  • 举报
回复
优势就是分布式 如果用java来实现算法可能只是单个节点计算要用分布式几个节点同时计算开发量非常巨大, mapreduce已经有规范只要按框架写算法就可以不用考虑太多分布式的问题。
kazoroth 2017-08-05
  • 打赏
  • 举报
回复
优势就是比传统方式访问文件系统要强,其他都是劣势,但其实应该考虑用spark tez storm这些
tom_fans 2017-07-04
  • 打赏
  • 举报
回复
MAP REDUCE实际有很多弱点,优势就是分布式,缺点太多, 因此出现了很多MAP REDUCE变成模式。 之前我特别讨厌MAP REDUCE,后来用着用着,感觉还行。
shiter 2017-06-05
  • 打赏
  • 举报
回复
优势我觉的是构建方便,充分利用现有机器性能 管理方便
水方子 2017-06-02
  • 打赏
  • 举报
回复
hadoop提供的jar包可以适应多种程序要求。自己写的是针对你当前文件和要求的。可以不考虑多种因素。mapreduce最大的好处是结合多台机器。能把超级服务器才能处理的数据。放在多台普通机器上实现。

20,808

社区成员

发帖
与我相关
我的任务
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
  • 分布式计算/Hadoop社区
  • 涤生大数据
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧