在hadoop运行mapreduce的经典例子Terasort时遇到生成数据乱码问题,求大神解答

Dawn_爱小香猪 2017-06-19 11:16:28
如图,测试一个mapreduce自带的排序算法的例子terasort时,第一步teragen生成的数据是本来应该是这样的





但是我的生成却是这样的


同样的 进行第二部terasort之后结果也是带乱码的
不过最后一步TeraValidate进行结果校验倒是似乎没有问题,输出是这样的

checksum 365ed3f3e1


请问各位大神如何正确显示输入和输出呢?我试过下载下来输入和输出的文件,然后把编码格式改成utf-8 仍然是乱码。
...全文
496 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
Dawn_爱小香猪 2017-06-19
  • 打赏
  • 举报
回复
引用 3 楼 sjtlll123 的回复:
贴出来 环境配置


环境是VWware Workstation 12.0,运行的linux的版本是centOS6.4 hadoop版本是2.2.0

这是修改的配置文件:
1.hadoop-env.sh


2.core-site.xml

3.hdfs-site.xml

4.mapred-site.xml.template(重命名为mapred-site.xml)



hadoop版本信息
sjtlll123 2017-06-19
  • 打赏
  • 举报
回复
贴出来 环境配置
Dawn_爱小香猪 2017-06-19
  • 打赏
  • 举报
回复
引用 1 楼 ruijuly 的回复:
环境 配置 贴出来啊



环境是VWware Workstation 12.0,运行的linux的版本是centOS6.4 hadoop版本是2.2.0

小弟刚刚接触分布式计算 不知道还有什么需要贴的 还请赐教
ruijuly 2017-06-19
  • 打赏
  • 举报
回复
环境 配置 贴出来啊

20,808

社区成员

发帖
与我相关
我的任务
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
  • 分布式计算/Hadoop社区
  • 涤生大数据
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧