没用过命令行版本。我这里将 rdd 格式化输出到 hdfs 的 scala 代码是这么写的:rdd3.map(item => { (NullWritable.get(), new Text(item._1 + ", " + item._2)); }).saveAsHadoopFile[TextOutputFormat[NullWritable, Text]](dir);dir 是输出的 hdfs 目录。
rdd3.map(item => { (NullWritable.get(), new Text(item._1 + ", " + item._2)); }).saveAsHadoopFile[TextOutputFormat[NullWritable, Text]](dir);
你直接把元组数组打印出来它自然就是那个样子了,你自己用 println 的方式打印一下不就完了。
20,808
社区成员
4,690
社区内容
加载中
试试用AI创作助手写篇文章吧