rdd /dataset 多列分组聚合排序

一直有梦想的咸鱼 2019-09-07 03:09:06

按第一列分组，分组后: 再按第三列值降序排列，如果第二列相同的需要累加第三列的值，比如数据如下：

A,a,3
B,c,4
A,b,5
D,a,6
A,a,6
D,b,5
B,d,2
统计完后变成：

A,a,9
A,b,5
B,c,4
B,d,2
D,a,6
D,b,5
请问大侠们，这个如何实现啊？跪谢！spark core或者 spark sql实现都可以

...全文