大量日志分析的问题,求方法,面试中问到的

天下有爽 2012-09-20 04:28:06
对一个服务器日志的分析
日志里面记录了IP登陆信息,信息内容有时间和IP地址。现在要统计
1) 每一天登陆次数最多的1000个ip。以登陆次数为序,从高到低排序
2) 每一周登陆的最多的1000个ip。以登陆次数为序,从高到低排序
每一天大概有10亿条IP信息记录


如果面试中问道这种问题,该怎么回答?
...全文
416 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
Alex20150716 2012-09-26
  • 打赏
  • 举报
回复
这是干神马,查神马啊。友情帮顶!!!
大叔obnijeh 2012-09-26
  • 打赏
  • 举报
回复
困了,睡个午觉。
navylhw 2012-09-26
  • 打赏
  • 举报
回复
写一个 mapreduce程序,找出 topK 就可以了吧,网上有源码的,为了提高速度,你可以重载一些解析函数
追夢人2021 2012-09-20
  • 打赏
  • 举报
回复
沙发,我也很想知道答案,关注中。。。。。

7,394

社区成员

发帖
与我相关
我的任务
社区描述
其他数据库开发 数据仓库
社区管理员
  • 数据仓库
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧