社区
Hadoop生态社区
帖子详情
Hadoop可否作为服务进行实时处理
Jack_Chai
博客专家认证
2012-03-16 11:20:05
可能我的问题比较out。可以说我对hadoop也是一知半解。只知道hadoop是针对大数据量进行分布式处理的框架。
但是现在有个疑问:
hadoop很多都用在日志处理上。但是日志是动态不停的生成的。作为map-reduce应用,hadoop是否可以实现日志的实时分析处理?还是说只能处理内容不会再改变的日志(例如昨天的,上个月的等等)?希望大牛们给予解答。如果我的描述还不是很清楚的话,也希望大牛们提出来,我会再补充。
...全文
445
6
打赏
收藏
Hadoop可否作为服务进行实时处理
可能我的问题比较out。可以说我对hadoop也是一知半解。只知道hadoop是针对大数据量进行分布式处理的框架。 但是现在有个疑问: hadoop很多都用在日志处理上。但是日志是动态不停的生成的。作为map-reduce应用,hadoop是否可以实现日志的实时分析处理?还是说只能处理内容不会再改变的日志(例如昨天的,上个月的等等)?希望大牛们给予解答。如果我的描述还不是很清楚的话,也希望大牛们提出来,我会再补充。
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
春风剑客
2012-03-19
打赏
举报
回复
Hadoop做不了实时处理,反应时间太慢,如果拿来做应用程序的系统就死定了。
Jack_Chai
2012-03-19
打赏
举报
回复
感谢“maxim_sin”的回答。确实作为大吞吐量的计算框架,如果要求实时性还是很难的。你说的这点我也比较赞同“有时一个job可能会运行几个小时”。毕竟启动了任务之后,自己的工作还可能做不完呢,怎么有时间去处理实时得来的数据?有人可能说:“你可以在项目一开始的时候就引入Hadoop啊。这样就可以实时了”。但是别忘了,还有数据量的限制呢。假如你的Hadoop群集只有几台机器,而数据又太多,导致不能实时处理完毕,数据就会积压,越积越多,最终永远也干不完。为了避免这种问题,就干脆让它处理有限量的数据。其他网友视回答情况也给了分数,结贴。
SVKING
2012-03-18
打赏
举报
回复
每次启动hadoop,hadoop会结合日志文件对数据进行更新,可能还会结合secondarynamenode。而每次的操作并不是马上对数据进行更新的。好像是这样的,我在书上看到的,具体的记不太清楚了。书也不在我这了,不好意思。。。这个回答仅供参考
Michael_Xin_CV
2012-03-18
打赏
举报
回复
楼主的问题很好 切中Hadoop的要害 hadoop是针对
批处理
作业的 特点是数据吞吐量大 但是一旦一个job启动就不能再进行更改 有时一个job可能会运行几个小时。
你说的问题其实是实时MapReduce问题,这个是目前hadoop研究的重点之一 楼主可以参考twitter的Storm框架 专门针对实时性大数据流
写字不容易 求给分~
huoqie115
2012-03-17
打赏
举报
回复
我感觉不可以,从一开始Hadoop就不是在强调反应时间,他强调的是高吞吐量。
liutengfeigo
2012-03-16
打赏
举报
回复
不知道.路过.学习.
基于
hadoop
平台hive数据库处理电影数据(8965字数32页).doc
本系统主要设计完成两件工作,一是搭建分布式的
hadoop
的集群环境,二是基于分布式的集群环境做日志分析。详细介绍参考:https://blog.csdn.net/newlw/article/details/127332767
Hadoop
的辉煌还能延续多久?
Hadoop
的辉煌还能延续多久?
hadoop
-2.7.2.rar
hadoop
2.7.2 linux版本,需要在window上解压缩
hadoop
-3.2.0部署及相关工具
hadoop
-3.2.0 eclipse内含
hadoop
-eclipse-plugin 插件 本地测试所需必要的
hadoop
-3.2.0对应的bin
Linux_RedHat、CentOS上搭建
Hadoop
集群
Hadoop
是一个能够对大量数据
进行
分布式处理的软件框架。但是
Hadoop
是以一种可靠、高效、可伸缩的方式
进行
处理的。
Hadoop
是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。
Hadoop
是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。
Hadoop
还是可伸缩的,能够处理 PB 级数据。此外,
Hadoop
依赖于社区
服务
器,因此它的成本比较低,任何人都可以使用。
Hadoop生态社区
20,848
社区成员
4,696
社区内容
发帖
与我相关
我的任务
Hadoop生态社区
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
复制链接
扫一扫
分享
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章