大数据必知必会：Zookeeper集群环境安装

wux_labs 2023-01-19 18:15:58

大数据必知必会：Zookeeper集群环境安装

安装前准备
操作系统准备
安装Java 8+
下载Zookeeper安装包
集群环境安装
解压安装包
修改配置文件
相关命令
启动Zookeeper
查看状态
验证Zookeeper
停止Zookeeper

安装前准备

集群环境下，至少需要3台服务器。

IP地址	主机名称
10.0.0.5	node1
10.0.0.6	node2
10.0.0.7	node3

需要保证每台服务器的配置都一致，以下步骤在3台服务器上都需要做一次。

操作系统准备

本次安装采用的操作系统是Ubuntu 20.04。

更新软件包列表。

sudo apt-get update

安装Java 8+

使用命令安装Java 8。

sudo apt-get install -y openjdk-8-jdk

配置环境变量。

vi .bashrc

export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64

让环境变量生效。

source .bashrc

下载Zookeeper安装包

从Zookeeper官网Apache ZooKeeper下载安装包软件。

或者直接通过命令下载。

wget https://dlcdn.apache.org/zookeeper/zookeeper-3.8.0/apache-zookeeper-3.8.0-bin.tar.gz

集群环境安装

解压安装包

在3台服务器上，分别将安装包解压到目标路径。

mkdir -p apps
tar -xzf apache-zookeeper-3.8.0-bin.tar.gz -C apps

修改配置文件

Zookeeper的配置文件保存在$ZOO_HOME/conf/zoo.cfg。

在3台服务器上都复制一份配置文件。

cp apps/apache-zookeeper-3.8.0-bin/conf/zoo_sample.cfg apps/apache-zookeeper-3.8.0-bin/conf/zoo.cfg

配置文件说明：

# The number of milliseconds of each tick
# 通信心跳时间，Zookeeper服务器与客户端心跳时间，单位毫秒。
tickTime=2000

# The number of ticks that the initial 
# synchronization phase can take
# LF初始通信时限
# Leader和Follower初始连接时能容忍的最多心跳数，单位次（即tickTime的数量）
initLimit=10

# The number of ticks that can pass between 
# sending a request and getting an acknowledgement
# LF同步通信时限
# Leader和Follower连接之后，通信时能容忍的最多心跳数，单位次
# 时间如果超过syncLimit * tickTime，Leader认为Follwer挂掉，从服务器列表中删除Follwer
syncLimit=5

# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just 
# example sakes.
# Zookeeper数据存放目录
dataDir=/home/hadoop/data/zookeeper

# the port at which the clients will connect
# 客户端连接端口，通常不做修改
clientPort=2181

在集群模式下，还有一个重要的配置项，server.A=B:C:D，其中 A 是一个数字，表示这个是第几号服务器；B 是这个服务器的IP地址；C 是这个服务器与集群中的 Leader 服务器交换信息的端口；D 是集群中的 Leader 服务器挂了之后重新进行选举新的 Leader时服务器相互通信的端口。由于集群环境的IP地址不同，所以3台服务器的配置文件可以保持完全相同。

在3台服务器上都配置为：

# Zookeeper数据存放目录
dataDir=/home/hadoop/data/zookeeper
# 客户端连接端口
clientPort=2181
# 服务器节点配置
server.1=10.0.0.5:8881:7771
server.2=10.0.0.6:8881:7771
server.3=10.0.0.7:8881:7771

在3台服务器上都创建数据存放目录。

mkdir -p /home/hadoop/data/zookeeper

在 dataDir 指定的目录下创建名为 myid 的文件，文件内容和 zoo.cfg 中server.A=B:C:D的 A 一致。

node1上执行

echo 1 > /home/hadoop/data/zookeeper/myid

node2上执行

echo 2 > /home/hadoop/data/zookeeper/myid

node3上执行

echo 3 > /home/hadoop/data/zookeeper/myid

相关命令

如果没配置环境变量，则需要切换到安装目录下执行相关命令，或者指定命令的绝对路径。

cd apps/apache-zookeeper-3.8.0-bin

启动Zookeeper

在集群环境下，需要在每台服务器上都启动Zookeeper。

bin/zkServer.sh start

node1

node2

node3

QuorumPeerMain 就是 Zookeeper 服务端的进程。

查看状态

分别在每台服务器上查看状态。

bin/zkServer.sh status

node1

node2

node3

Mode: leader 表示Leader进程。

Mode: follower 表示Follower进程。

验证Zookeeper

数据操作验证

连接集群，写入数据，查看数据，再切换到其他节点查看数据。

bin/zkCli.sh -server 10.0.0.5:2181
bin/zkCli.sh -server 10.0.0.6:2181
bin/zkCli.sh -server 10.0.0.7:2181

在节点1上写入数据。

在节点2上进行验证。

在节点3上进行验证。

Leader重选验证

当前状态下节点2是Leader，停止节点2的进程，查看其他两个节点的状态。

bin/zkServer.sh stop

节点3变为新的Leader。

停止Zookeeper

分别在每台服务器上停止进程。

bin/zkServer.sh stop

...全文

276 回复打赏收藏转发到动态举报

写回复

用AI写文章

切换为时间正序

请发表友善的回复…

发表回复

Zookeeper集群环境安装

文章目录一、学前必备知识二、Zookeeper 简介三、Zookeeper 安装及配置、启动 Zookeeper 集群四、Zookeeper 数据模型以及节点类型五、ZooKeeper 的 shell 操作六、ZooKeeper Watcher(监听机制)七、ZooKeeper 选举机制7.1 全新集群选举7.2 非全新集群选举八、ZooKeeper 是如何实现数据一致性的呢？九、ZooKeeper Java API 操作一、学前必备知识 2021年全网最细大数据学习笔记（一）：初识 Hadoop 2

Zookeeper伪分布式安装

Kali Linux 搭建Zookeeper集群大三的下学期，Hadoop课程中需要学习高可用，

大数据框架-ZooKeeper 简介：概述： Zookeeper 是一个开源的分布式的，为分布式框架提供协调服务的 Apache 项目。 Zookeeper从设计模式角度来理解：是一个基于观察者模式设计的分布式服务管理框架，它负责存储和管理大家都关心的数据，然后接受观察者的注册，一旦这些数据的状态发生变化，Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应对于ZooKeeper来说，是监控Hadoop生态圈，为数据和系统的正常执行提高保障和监控，如果监控到哪个环节出现

冰河社区

98,254

社区成员

1,726

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章