社区
Hadoop生态社区
帖子详情
hadoop问题请教??
yangzhengm
2012-12-04 04:33:47
请问一下,hadoop处理的数据从哪里来???有没有专门提供练习的数据包之类的,还是通过淘宝等开放平台的api连接到它的数据中心开发或者抓取它的web信息作分析,谢谢。
...全文
202
4
打赏
收藏
hadoop问题请教??
请问一下,hadoop处理的数据从哪里来???有没有专门提供练习的数据包之类的,还是通过淘宝等开放平台的api连接到它的数据中心开发或者抓取它的web信息作分析,谢谢。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
cranley
2013-01-08
打赏
举报
回复
HADOOP分两部分,HDFS文件系统和MapReduce计算框架 HDFS只是提供一个文件存取操作的接口,一般是调用HADOOP包里面的API往往上面写文件就是了 MAPREDUCE是处理HDFS上面文件的计算框架,一般要自己根据业务开发JAR包来运行,以处理已经上载的文件。 你说的数据获取和算法的改进,就要自己根据业务系统去实现了。
yangzhengm
2012-12-06
打赏
举报
回复
好的,非常感谢你的建议,想必你弄过hadoop吧。但是我更关心的是数据的获取,呵呵,运行环境的搭建可以有参考书之类的,但是下面一步就是有效数据的获取和算法的改进,希望能够继续得到你的帮助。谢谢!
BaYangMoBeiBei
2012-12-05
打赏
举报
回复
hadoop处理的数据,是放在HDFS上。 Hadoop刚开始主要包括HDFS和MapReduce,现在Hadoop越来越成熟了,HDFS和MapReduce都可以独立研究,Hadoop也能兼容其他的分布式文件系统了。 你如果想用hadoop,建议先自己在Linux下搭建一个Hadoop环境,配置成伪分布式模式,网上有很多教程的。hadoop官网有一个WordCount实例,这就相当于编程的HelloWorld级别的一个MapReduce程序,有本书是Hadoop权威指南,你可以看一下
hadoop
学习资料
hadoop
学习资料,基础学习。。。。。。。。。。。。。。
Hadoop
管理员的十个最佳实践
接触
Hadoop
有两年的时间了,期间遇到很多的
问题
,既有经典的NameNode和JobTracker内存溢出故障,也有HDFS存储小文件
问题
,既有任务调度
问题
,也有MapReduce性能
问题
.遇到的这些
问题
有些是
Hadoop
自身的缺陷(短板),有些则是使用的不当。在解决
问题
的过程中,有时需要翻源码,有时会向同事、网友
请教
,遇到复杂
问题
则会通过mail list向全球各地
Hadoop
使用者,包括
Hadoop
Committer(
Hadoop
开发者)求助。在获得很多人帮助后,自己将遇到
问题
和心得整理成文,希望本文可以对那些焦头烂额的Hado
云计算与大数据课程考核方案解析及实战指南-可实现的-有
问题
请联系博主,博主会第一时间回复!!!
内容概要:本文详细介绍了《云计算与大数据》课程的考核方案,包括考核内容、要求、完成时间和提交方式。同时,文章还列出了详细的实验目的和实验步骤,帮助学生理解和掌握虚拟机启动、HDFS和YARN的启动、
Hadoop
Java API的操作、Linux命令的使用以及倒序索引的具体实现。 适合人群:适合选修《云计算与大数据》课程的在校大学生,尤其是计算机专业的学生。 使用场景及目标:本方案适用于学生的实验报告撰写和提交,旨在帮助学生通过实践加深对云计算和大数据的理解,提高实际操作能力。具体目标包括熟悉虚拟机、HDFS和YARN的启动流程,熟练掌握
Hadoop
Java API的基本操作,了解并应用Linux的相关命令,完成倒序索引的各个阶段。 阅读建议:仔细阅读每个实验步骤并按要求操作,及时记录实验过程和结果,确保按时提交完整的实验报告。建议在实验过程中遇到
问题
时积极查阅资料或向教师
请教
,以获得更好的学习效果。 -可实现的-有
问题
请联系博主,博主会第一时间回复!!!
三级数据库真题与答案
三级数据库真题大全同时有答案,希望对大家有用
Java学习之路:不走弯路,就是捷径!!
Java学习之路:不走弯路,就是捷径!!
Hadoop生态社区
20,846
社区成员
4,695
社区内容
发帖
与我相关
我的任务
Hadoop生态社区
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
复制链接
扫一扫
分享
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章