社区
Hadoop生态社区
帖子详情
active namenode的editsLog先写到JournalNode还是先写到本地?写到本地的作用是什么?
相见恨晚xyh
2017-11-01 09:42:30
我在启动集群的时候发现,查看webui,active namenode加载完fsimage之后,并不会加载本地editsLog,而是加载JournalNode上的editsLog,那么写本地的意义何在?忘大神解惑下。
...全文
532
2
打赏
收藏
active namenode的editsLog先写到JournalNode还是先写到本地?写到本地的作用是什么?
我在启动集群的时候发现,查看webui,active namenode加载完fsimage之后,并不会加载本地editsLog,而是加载JournalNode上的editsLog,那么写本地的意义何在?忘大神解惑下。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
2 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
不写程序只算命。
2018-07-26
打赏
举报
回复
是先写到JNS中,在写到本地中的,可以在代码中看到。
大数据开发技术.pdf
在 HDFS 中,Name
Node
的主要功能是什么? 1 我们把目录结构及文件分块位置信息叫做元数据。Name
node
负责 维护整个 hdfs 文件系统的目录树结构,以及每一个文件所对应的 block 块信息(block 的 id,及所在的 data
node
服务器) 。 2 Name
node
节点负责确定指定的文件块到具体的 Data
node
结点的 映射关系。在客户端与数据节点之间共享数据 3 管理 Data
node
结点的状态报告, 包括 Data
node
结点的健康状态报 告和其所在结点上数据块状态报告,以便能够及时处理失效的数据结 点。 Name
Node
与 SecondaryName
Node
的区别与联系? 1. Name
Node
负责管理整个文件系统的元数据, 以及每一个路径 (文 件)所对应的数据块信息。2.SecondaryName
Node
主要用于定 期 合 并 命 名 空 间 镜 像 和 命 名 空 间 镜 像 的 编 辑 日 志 。 1.SecondaryName
Node
中保存了一份和 name
node
一致的镜 像文件(fsimage)和编辑日志(
edit
s) 。2.在主 name
node
发生 故障时(假设没有及时备份数据) ,可以从 SecondaryName
Node
HDFS 读数据流程? 1. 跟 name
node
通信查询元数据,找到文件块所在的 data
node
服务 器 2.挑选一台 data
node
(就近原则,然后随机)服务器,请求建立 socket 流 3.data
node
开始发送数据(从磁盘里面读取数据放入流, 以 packet 为单位来做校验)4.客户端以 packet 为单位接收,先在 本地缓存,然后
写
入目标文 Hadoop 集群中 Hadoop 需要启动哪些进程, 它们的
作用
分别是什么? 1.Name
Node
它是 hadoop 中的主服务器,管理文件系统名称空间和 对 集 群 中 存 储 的 文 件 的 访 问 , 保 存 有 metadate 。 2.SecondaryName
Node
它不是 name
node
的冗余守护进程,而是 提供周期检查点和清理任务。 帮助 NN 合并
edit
s
log
, 减少 NN 启动时 间。3.Data
Node
它负责管理连接到节点的存储(一个集群中可以有 多个节点) 。每个存储数据的节点运行一个 data
node
守护进程。 4.ResourceManager(JobTracker) JobTracker 负责调度 Data
Node
上的工作。每个 Data
Node
有一个 TaskTracker,它们执行实际工作。5.
Node
Manager(TaskTracker) 执行任务 6.DFSZKFailoverController 高可用时它负责监控 NN 的状 态,并及时的把状态信息
写
入 ZK。它通过一个独立线程 周期性的调用 NN 上的一个特定接口来获取 NN 的健康状态。FC 也有 选择谁作为
Active
NN 的权利,因为最多只有两个节点,目前选择策略 还比较简单(先到先得,轮换)7.
Journal
Node
高可用情况下存放 name
node
的
edit
log
文件. 在 CentOS 环境下,按照伪分布方式安装和配置 Hadoop 平台的主要 过程。 1. hadoop 安装包下载 2、hadoop 安装包解压 3、hadoop 伪分布式 环境搭建环境搭建步骤如下:1、将 hadoop 安装目录添加到系统环 境变量(~/.bash_profile)2、配置 hadoop 环境的配置文件 hadoop-env.sh3、配置 hadoop 核心文件 core-site.xml4、配置 HDFS 文件 hafs-site.xml Mapreduce 中,Partitioner 操作的
作用
? MapReduce 提供 Partitioner 接口,它的
作用
就是根据 key 或 value 及 reduce 的数量 来决定当前的这对输出数据最终应该交由哪个 reduce task 处理。默认 对 key hash 后再以 reduce task 数量取模。默认的取模方式只是为了 平均 reduce 的处理能力, 如果用户自己对 Partitioner 有需求, 可以订 制并设置到 job 上。 HDFS 中的
写
数据流程。 (1) Client 向 Name
Node
发起文件
写
入的请求。 (2) Name
Node
根 据文件大小和文件块配置情况,返回给 Client 它所管理部分 Data
Node
的信息。 (3) Client 将文件划分为多个 Block,根据 Data
Node
的地址信息,按顺序
写
入到每一个 Data
Node
HDFS HA 场景下Name
Node
journal
node
数据损坏以及故障恢复
项目场景: HDFS HA 场景下Name
Node
故障恢复 问题描述: 提示:这里描述项目中遇到的问题: 例如:数据传输过程中数据不时出现丢失的情况,偶尔会丢失一部分数据 APP 中接收数据代码: @Override public void run() { bytes = mmInStream.read(buffer); mHandler.obtainMessage(READ_DATA, bytes, -1, buffer).sendToT
大数据视频_Hadoop视频教程(上)
课程特点: 1、全程案例贯穿始终,几乎每个知识点都有配套的案例; 2、整个框架深入源码讲解; 3、优化措施全部来源于企业开发; 4、Hadoop相关企业真题全覆盖。 本课程中你将学习到,Hadoop完全分布式集群搭建、Hadoop源码编译、HDFS的Shell操作、HDFS的API操作、HDFS的IO流操作、HDFS读
写
数据流程、Name
Node
和SecondaryName
Node
工作机制、Data
Node
工作机制、集群节点动态服役和退役、HDFS2.x新特性、MapReduce编程规范、自定义序列化、自定义InputFormat、自定义OutputFormat、分区、排序、合并、分组、ReduceJoin、MapJoin、数据清洗、计数器、TopN案例、倒排索引案例、MapTask工作机制、ReduceTask工作机制、Shuffle工作机制、MapReduce工作流程、Job提交流程源码、MapReduce源码、数据压缩、Yarn工作机制、作业提交流程、YARN资源调度器、MapReduce企业优化、HDFS小文件企业优化、数据倾斜优化等。
HadoopHA 中
Journal
Node
作用
在hadoopHA中两个name
node
节点为了数据同步会通过
Journal
node
相互通信。
Journal
Node
存储管理
Edit
s
Log
,俩个name
node
共享这个
Edit
s
Log
,两个Name
Node
都可以读取
Edit
s;但
Edit
s
Log
只有
Active
状态的Name
Node
节点可以做
写
操作; ...
检查点机制,Fsimage与
Edit
log
的合并过程理解
fsimage文件:即命名空间映像文件,是内存中的元数据在硬盘上的checkpoint,包含文件系统中的所有目录和文件i
node
的序列化信息。
edit
log
:文件系统的
写
操作首先把它记录在
edit
log
中。 检查点机制:定时将fsimage和
edit
log
合并并产生新的fsimage的过程,这一过程非常耗费cpu和IO,一般放在Secondary Name
node
(非HA)和Standby Name
node
(HA)中完成。 (一)secondary name
node
执行检查点操作(非HA): sec
Hadoop生态社区
20,808
社区成员
4,690
社区内容
发帖
与我相关
我的任务
Hadoop生态社区
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
复制链接
扫一扫
分享
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章