hadoop中mapred、yarn至hdfs有什么方法可以读取到文件分布？

darvei 2016-01-06 06:28:48

求教问题：

在hadoop的hdfs里面若要获得一个已经存入文件的分布情况（blocks），该如何操作？
在mapred中，运行mapper如何获得文件的分布情况？

又如何将其读取出来？速度较快的方式，除hdfs的流方式之外。

谢谢了。

...全文

110 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

课程简介： ...由浅入深地讲解了Hadoop三大模块：HDFS、YARN及 MapReduce。课程内容：

Hadoop 之集群安装（HDFS、YARN）

hadoop,hdfs,yarn,mapreduce

Hadoop 是一个开源的分布式计算和存储框架，它的作用非常简单，就是在多计算机集群环境中营造一个统一而稳定的存储和计算环境，并能为其他分布式应用服务提供平台支持，相当于在某种程度上将多台计算机组织成了一台计算机。 Hadoop 框架最根本的原理就是利用大量的计算机同时运算来加快大量数据的处理速度。Hadoop 集群可运行于一般的商用服务器上，具有高容错、高可靠性、高扩展性等特点。适合一次写入，多次读取的场景，不适合频繁修改文件及大量的小文件和低延时的数据访问。本文将对Hadoop 的三大核心组件进行介绍

前言：配置hadoop，主要是配置core-site.xml,hdfs-site.xml,mapred-site.xml三个配置文件。上网找的配置可能因为各个hadoop版本不同，导致无法生效，这里需要经验积累。参数繁多，不用过多纠结每个参数的含义，先照搬网上的参数，用多几次，总会出现bug，需要反复调整的参数就是常用参数。 ±±±±±±±±±±±±±±±±±±±±±±±±±±±±±±±±...

Hadoop生态社区

20,809

社区成员

4,691

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章