spark数据处理问题

ranwei0206 2018-09-19 09:08:12
网关MAC 手机号码 域名三个元素同时出现频次,同时首次和同时最后出现时间。
输入数据格式:0网关mac 1手机号码 2域名 3时间戳 4网关区域码
例如:
输出数据格式:0网关mac 1手机号码 2域名 3频次 4首次出现时间戳 5最后出现时间戳 6网关区域码
小白初学,不知道怎么处理,望指点。前面数字是索引旨在看起来方便。
...全文
147 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

1,261

社区成员

发帖
与我相关
我的任务
社区描述
Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
社区管理员
  • Spark
  • shiter
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧