只有mapper的job输出会写到hdsf吗？

groovy2007 2013-11-24 11:20:05

初学hadoop，有些问题想请教各位大神。

mapper的输出是写到local文件系统的。
如果只有mapper，而没有reducer，即job.setNumReduceTasks(0);
想把mapper的输出作为最终结果，这时候mapper的输出会写到hdfs吗？
另外，如果没有reducer，shuffle还会执行吗？

多谢了！

...全文

308 3 打赏收藏转发到动态举报

写回复

用AI写文章

3 条回复

切换为时间正序

请发表友善的回复…

发表回复

groovy2007 2013-11-25

打赏
举报

多谢多谢！

少主无翼 2013-11-24

打赏
举报

依旧会输出到hdfs中，也就是你配置的output Path，输出路径必须指出，但是shuffle不会执行，因为shuffle是reduce获取mapper结果的操作，所以没有reduce自然不会发生shuffle。

groovy2007 2013-11-24

打赏
举报

补充一下，hadoop权威指南里的一个例子第8章的排序一节 hadoop jar hadoop-examples.jar SortDataPreprocessor input/ncdc/all input/ncdc/all-seq 该程序是没有reducer的，也需要指定输出目录吗？根据书中的意思all-seq应该是输出目录

本文介绍了一个使用Hadoop MapReduce处理多个文件的具体实现，包括Mapper和Reducer类的定义，以及Driver类的配置和运行流程。通过示例代码展示了如何获取文件名并将其作为键值对的一部分进行处理。

本文介绍了一个使用Hadoop实现的多文件WordCount程序，该程序能够处理不同格式的文本输入，通过定制化的Mapper处理逗号分隔和空格分隔的文本数据，并汇总词频。

本文详细介绍了Hadoop核心框架MapReduce的工作原理，包括分布式处理的特点及其在WordCount任务中的应用步骤。从数据切片到结果合并，通过具体实例说明了如何利用MapReduce提高数据处理效率。

本文介绍了一种从HDFS文件系统导入数据到HBase数据库的方法。通过使用MapReduce框架，实现了一个名为ImportFromFile的类，该类继承自Mapper，并能够将文件中的每一行数据转换为HBase中的记录。