社区
数据仓库
帖子详情
大量日志分析的问题,求方法,面试中问到的
天下有爽
2012-09-20 04:28:06
对一个服务器日志的分析
日志里面记录了IP登陆信息,信息内容有时间和IP地址。现在要统计
1) 每一天登陆次数最多的1000个ip。以登陆次数为序,从高到低排序
2) 每一周登陆的最多的1000个ip。以登陆次数为序,从高到低排序
每一天大概有10亿条IP信息记录
如果面试中问道这种问题,该怎么回答?
...全文
416
4
打赏
收藏
大量日志分析的问题,求方法,面试中问到的
对一个服务器日志的分析 日志里面记录了IP登陆信息,信息内容有时间和IP地址。现在要统计 1) 每一天登陆次数最多的1000个ip。以登陆次数为序,从高到低排序 2) 每一周登陆的最多的1000个ip。以登陆次数为序,从高到低排序 每一天大概有10亿条IP信息记录 如果面试中问道这种问题,该怎么回答?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Alex20150716
2012-09-26
打赏
举报
回复
这是干神马,查神马啊。友情帮顶!!!
大叔obnijeh
2012-09-26
打赏
举报
回复
困了,睡个午觉。
navylhw
2012-09-26
打赏
举报
回复
写一个 mapreduce程序,找出 topK 就可以了吧,网上有源码的,为了提高速度,你可以重载一些解析函数
追夢人2021
2012-09-20
打赏
举报
回复
沙发,我也很想知道答案,关注中。。。。。
【
面试
宝典】10道
日志分析
ELK高频题库整理(附答案背诵版)
ELK 是一个开源的
日志分析
平台,由三个开源软件组成:Elasticsearch、Logstash 和 Kibana。它可以帮助开发人员和运维人员对日志进行收集、处理、存储、搜索、分析和可视化。Elasticsearch 是一个分布式搜索和分析引擎,可以快速地存储、检索和分析
大量
数据。它使用 JSON 文档来存储数据,并提供了基于 RESTful API 的查询接口。Logstash 是一个强大的日志收集和处理器,可以接收、解析、转换和传输日志数据。
面试
JAVA常被问到的
问题
(持续更新中)
引言 有的
面试
会被问到有没有写博客,这时候我尴尬,不知道怎么回答,所以这篇文章仅仅是把我
面试
JAVA的遇到的
问题
记录下来而已,也算是我写博客迈出的第一步,起码,以后被问到:有没有写博客?我可以回答,我写过。 (最主要的是以后换工作我不用频繁百度常见
面试
题了。。。。) ps 1,别把我太当回事,我是个LJ; 2,说得不对的地方请多多包涵,想看更详细的请百度官方文档和其他大佬的文章; 3,如果有被问到......
算法
面试
必备-----数据分析常见
面试
题
算法
面试
必备-----数据分析常见
面试
题算法
面试
必备-----数据分析常见
面试
题统计学
问题
问题
:贝叶斯公式复述并解释应用场景
问题
:朴素贝叶斯的理解概率
问题
问题
:扑克牌54张,分成2份,
求
这2份都有2张A的概率数据库
问题
问题
:left join,right join,inner join,full join之间的区别?
问题
:having和where的区别?
问题
:mysql中设置row number
问题
:如何写SQL
求
出中位数平均数和众数(除了用count之外的
方法
)机器学习
问题
问题
:如何避免决策树过拟合?
问题
面试
中如果被问到项目遇到的难题如何解决
面试
中如果被问到项目遇到的难题如何解决
面试
专区|【DevOps-10道
日志分析
ELK高频题整理(附答案背诵版)】
ELK 是一个开源的
日志分析
平台,由三个开源软件组成:Elasticsearch、Logstash 和 Kibana。它可以帮助开发人员和运维人员对日志进行收集、处理、存储、搜索、分析和可视化。Elasticsearch 是一个分布式搜索和分析引擎,可以快速地存储、检索和分析
大量
数据。它使用 JSON 文档来存储数据,并提供了基于 RESTful API 的查询接口。Logstash 是一个强大的日志收集和处理器,可以接收、解析、转换和传输日志数据。
数据仓库
7,394
社区成员
6,741
社区内容
发帖
与我相关
我的任务
数据仓库
其他数据库开发 数据仓库
复制链接
扫一扫
分享
社区描述
其他数据库开发 数据仓库
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章