map 100% reduce 100% 卡住？运行一个简单的单词长度统计

c2mepunchme 2014-12-18 09:44:38

求助，在运行一个简单的单词长度统计时，总卡在 map 100% reduce 100%？
运行其他案例没有问题

首先保证输入文件当中的单词都不重复

目前还是搞不定，只好求助各位大神，谢谢啦！
贴上我的代码（vmware ubuntu12.04 hadoop-1.2.1 伪分布式）

import java.io.IOException;

import java.util.*;



import org.apache.hadoop.fs.Path;

import org.apache.hadoop.conf.*;

import org.apache.hadoop.io.*;

import org.apache.hadoop.mapred.*;

import org.apache.hadoop.util.*;





public class word_length_count {

   

  public static class Map extends MapReduceBase implements Mapper<LongWritable, Text, IntWritable, Text> {

     private Text word = new Text();

     private int length;

     public void map(LongWritable key, Text value, OutputCollector<IntWritable, Text> output, Reporter reporter) throws IOException {

       String line = value.toString();

       StringTokenizer tokenizer = new StringTokenizer(line," \t\n\r--,.:;?![]{}()'\"\\.\\|_");

       while (tokenizer.hasMoreTokens()) {

         word.set(tokenizer.nextToken());

           String wordString=word.toString();

         length=wordString.length();

         output.collect(new IntWritable(length), word);

       }

     }

   }



   public static class Reduce extends MapReduceBase implements Reducer<IntWritable, Text,IntWritable,Text> {



  private Text ttt = new Text();

     public void reduce(IntWritable key, Iterator<Text> values, OutputCollector<IntWritable,Text> output, Reporter reporter) throws IOException {

       int sum=0;

  //     length.set(key.toString()+":");

       while (values.hasNext()) {

         sum ++;

       }

ttt.set(""+sum);

       output.collect(key,ttt);

     }

   }



   public static void main(String[] args) throws Exception {

 







     JobConf conf = new JobConf(word_length_count.class);

     conf.setJobName("word_length_count");

     

     conf.setMapOutputKeyClass(IntWritable.class);

     conf.setMapOutputValueClass(Text.class);

     conf.setOutputKeyClass(IntWritable.class);

     conf.setOutputValueClass(Text.class);



     conf.setMapperClass(Map.class);

     conf.setReducerClass(Reduce.class);



     conf.setInputFormat(TextInputFormat.class);

     conf.setOutputFormat(TextOutputFormat.class);



     FileInputFormat.setInputPaths(conf, new Path(args[0]));

     FileOutputFormat.setOutputPath(conf, new Path(args[1]));



         

     JobClient.runJob(conf);



   }

}

...全文

1766 8 打赏收藏转发到动态举报

写回复

用AI写文章

8 条回复

切换为时间正序

请发表友善的回复…

发表回复

五哥 2018-08-02

打赏
举报

引用 6 楼 DeliJIn 的回复:

while (values.hasNext()) {
sum ++;
}
这里少一行 "values.next()"
while (values.hasNext()) {
values.next();
sum ++;
}

死循环

DeliJIn 2018-08-01

打赏
举报

while (values.hasNext()) {
sum ++;
}
这里少一行 "values.next()"
while (values.hasNext()) {
values.next();
sum ++;
}

小白鸽 2015-01-02

打赏
举报

把运行日志贴出来

weitao1234 2014-12-31

打赏
举报

加日志不就知道运行到哪一行代码了。

c2mepunchme 2014-12-19

打赏
举报

  while (values.hasNext()) {
         sum ++;
       }

应该是在这里循环了，一直不去list里面的值就循环了。改动之后就行了。但是为什么reduce显示100%呢？

skyWalker_ONLY 2014-12-19

打赏
举报

可以jps查看一下任务是否已经运行完毕

c2mepunchme 2014-12-18

打赏
举报

其实这个任务是接在前面一个任务之后的。我单独运行它发现总卡在map 100 reduce 100的位置，之前的一个任务能够顺利运行而且和这个差别不大，应该不是代码的问题吧，那是为什么呢？

最近在将hdfs中已经处理好的数据导入到mysql的时候遇到这么一个现象，当任务执行到 INFO mapreduce.Job: map 100% reduce 0% mapreduce任务卡在map100% ，任何reduce不继续执行。总结了以下解决办法：一，如果没有报错的话，可能是你mysql的数据库建表指定的主键不全，导致导入一部分数据后，主键出现相同字段，那么就造成阻塞了

我称这种bug是一个典型的“哈姆雷特”bug，就是指那种，报错情况相同但网上却会有各种五花缭乱解决办法的bug，让我们不知道哪一个才是症结所在。先看导入命令： [root@host25 ~]# sqoop export --connect "jdbc:mysql://172.16.xxx.xxx:3306/dbname?useUnicode=true&characterEncoding...

我称这种bug是一个典型的“哈姆雷特”bug，就是指那种“报错情况相同但网上却会有各种五花缭乱解决办法”的bug，让我们不知道哪一个才是症结所在。先看导入命令：[root@host25 ~]#sqoop export --connect "jdbc:mysql://172.16.xxx.xxx:3306/dbname?useUnicode=true&characterEncoding=ut...

用sqoop从HDFS导出数据到mysql，一直卡在Running job: job_1571036741208_0010，应该是内存太小，导致速度太慢在 yarn-site-xml中增加下面两个，然后分发给各个节点，再重启yarn即可 <property> <name>yarn.nodemanager.resource.memory-mb</name...

我正在使用hadoop map-reduce作业进行一些文本处理。我的工作完成了99.2％，并停留在上一个 map 工作上。map 输出的最后几行如下所示。上次，当出现此问题时，我尝试打印出map发出的键值，并注意到其中一个键具有与之关联的大量值，并且我认为它在对这些值进行排序时似乎卡住了。然后，我停止从 map 作业中使用该键，并且该键工作正常。我认为，同样的问题再次发生，并且打印键值对是一项繁...

Hadoop生态社区

20,848

社区成员

4,696

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章