第一个mapreduce程序wordcount

zengqingfu1442 2016-11-20 03:14:52

计/wordcount下的文件的单词数：
hadoop jar hadoop-mapreduce-examples-2.4.1.jar wordcount /wordcount2 /output2
出来这么些信息（其中一部分），怎么看统计的单词数是否正确？统计的结果是哪个？
Map-Reduce Framework
Map input records=1
Map output records=5
Map output bytes=57
Map output materialized bytes=61
Input split bytes=101
Combine input records=5
Combine output records=4
Reduce input groups=4
Reduce shuffle bytes=61
Reduce input records=4
Reduce output records=4
Spilled Records=8
Shuffled Maps =1
Failed Shuffles=0
Merged Map outputs=1
GC time elapsed (ms)=707
CPU time spent (ms)=5290
Physical memory (bytes) snapshot=221282304
Virtual memory (bytes) snapshot=631783424
Total committed heap usage (bytes)=137498624
Shuffle Errors

...全文

327 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

zengqingfu1442 2016-11-20

打赏
举报

回复

知道了，可以用hadoop fs -cat /output/part-r-00000 查看统计的各类单词数

四川大学IT企业实训，拓思爱诺大数据第二次作业，MapReduce编程，包括Hadoop wordcount程序，及flowcount流量统计程序，包括重写排序及分区函数

第五节 SpringBoot集成hadoop开发环境（复杂版的WordCount）前言环境清单创建SpringBoot项目创建包创建yml添加集群主机名映射hadoop配置文件环境变量HADOOP_HOME编写代码添加hadoop依赖jar包编译项目造数据IDEA远程...

1.MapReduce概要介绍 2.MapReduce示例运行与解析 3.搭建Eclipse Hadoop开发环境 4.WordCount案例实践 5.Yarn原理及架构

楼主花费了1天终于按照教程自己第一次成功运行了这个案例。 Hadoop: Intellij结合Maven本地运行和调试MapReduce程序 (无需搭载Hadoop和HDFS环境) 2016-05-24 12717 Hadoop maven 39 Hadoop: Run and Debug Hadoop ...

1,258

社区成员

1,168

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章