如何自定义Mapreduce中的OutputFormat实现将分区数据写入不同的目录?
我有一组输入数据,是采用了分区,如下所示:
a dt
1 `20120101
2 20120101
3 `20120202
4 20120202
5 20120303
6 20120303
上面的数据分成了3个区(以时间分区)。
我要自定义OutputFormat,使输出的数据是按照分区写入到不同的目录,即:
三组数据分别写入到path-20120101,path-20120202,path-20120303中。
请问各位大侠我如何自定义OutputFormat?都是需要重写哪些方法?