短时间内不同顾客的频次统计问题

yinghuigu 2021-03-30 05:22:10
各位高手,请问用MapReduce怎么实现这个算法:
10分钟内2个不同顾客在不同日期出现的次数。
比如
2021-03-10 09:00:00 张三
2021-03-10 09:01:00 李四
2021-03-10 09:02:00 王五

2021-03-29 10:00:00 张三
2021-03-29 10:01:00 李四

2021-03-30 09:03:00 张三
2021-03-30 09:05:00 李四
2021-03-30 09:15:00 王五

结果是 张三李四 3
张三王五 1
李四王五 2

...全文
618 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
~人 2021-06-30
  • 打赏
  • 举报
回复

哥们 你这个结果出来的吗 我想看看你是怎么写的? 谢谢

  • 打赏
  • 举报
回复
这人不就是类似 world count 计算吗?
chongchongone 2021-04-26
  • 打赏
  • 举报
回复
可以使用hive 首先:进行创建一个包含两列的ods层的数据表 然后:采用sql进行where筛选最近10分钟的数据,对于两个不同的顾客以及日期进行二次分组
LinkSe7en 2021-04-06
  • 打赏
  • 举报
回复
用hive sql一下就出来了 为啥要写MapReduce呢
yinghuigu 2021-04-01
  • 打赏
  • 举报
回复
有朋友给个思路吗

20,808

社区成员

发帖
与我相关
我的任务
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
  • 分布式计算/Hadoop社区
  • 涤生大数据
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧