hadoop streaming遇到一个很奇怪的问题
我用streaming去计算数据的条数
hadoop fs -rm -r -skipTrash /tmp/output;
hadoop jar /home/hadoop/hadoop-streaming.jar \
-input /data/000000_0 \
-output /tmp/output \
-mapper "wc -l"
得到的结果是两个数字,加起来才等于实际的条数,我的input文件只有一个,为什么好像是会分开两个去计算结果,是不是与这个文件的格式有什么关系???