HDFS的副本数为什么为3？

wocawuliao 2016-05-14 07:37:19

HDFS的副本数为什么为3，为什么不是2或者是4那？

...全文

1342 5 打赏收藏转发到动态举报

写回复

5 条回复

切换为时间正序

请发表友善的回复…

发表回复

逍遥_幻月 2016-06-25

打赏
举报

回复

默认为三但是可以修改

追梦码农 2016-06-22

打赏
举报

回复

副本数3 是数据可靠性和成本综合考虑的结果。

tianfang 2016-06-22

打赏
举报

回复

奇数方便表决

镜中夜 2016-06-21

打赏
举报

回复

在安装配置hadoop时，设置hdfs-site.xml时指定的保存的镜像数 <property> <name>dfs.replication</name> <value>3</value> </property>

Q-WHai 2016-06-17

打赏
举报

回复

默认的而已，可以自己设置啊。默认的 3 是两个在同一个机架，另一个在另一个机架。所以 3 是保证了足够的冗余下最小的备份数。

本文探讨了HDFS为何设定副本数为3，强调了副本在容错和性能提升方面的作用。同时，分析了HDFS的数据存储策略，并提到了在特定情况下，副本数可能导致的网络带宽瓶颈问题。此外，还讨论了HDFS的分布式文件系统特性及其与其他系统区别，以及Hadoop集群的副本使用策略。

本文介绍了如何将HDFS的副本数设置为3，详细步骤包括修改hdfs-site.xml配置文件。接着，文章讲解了基于MapReduce框架开发wordcount程序的过程，包括项目创建、引入HDFS相关jar包、代码编写、本地环境搭建和打包。最后，文章演示了在SSH上运行MapReduce的wordcount示例，并展示了运行结果。

本文深入探讨了HDFS中为何采用三副本策略，详细解释了一套副本如何分别存储于本地机架、同机架另一节点及不同机架节点上，以此优化数据可靠性、可用性并提升网络带宽利用率。

HDFS采用机架感知策略，通过在本地机架、同一机架和不同机架分别存放副本，减少机架间数据传输，提高写操作效率，降低网络带宽需求。

在CDH6.3.2CentOS7环境中，若将HDFS的副本数从1更改为3但未生效，因为新副本数仅影响新上传的数据表。解决方法是先更改副本数设置，然后重新上传以使新设置生效。

Hadoop生态社区

20,842

社区成员

4,695

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章