Hadoop组件——HDFS
1,HDFS简介 HDFS(Hadoop Distributed File System)是hadoop项目的核心子项目,在大数据开发通过分布式计算对海量数据进行存储与管理。它基于流数据模式访问和处理超大文件的需求而开发,可以运行在廉价的商用服务器上,为海量数据提供了不怕故障的存储方法,进而为超大数据集的应用处理带来了很多便利。HDFS的特点:HDFS非常适合使用商业硬件进行分布式存储和分布式处理。它具有容错性,可扩展性,并且扩展极其简单。 HDFS具有高度可配置性。大多...