Hadoop HA 구성하기 with Zookeeper (3) - Zookeeper 설정, Hadoop 실행

suran choi·2023년 3월 1일

Hadoop

목록 보기

6/6

Zookeeper

폴더 생성

# Zookeeper 데이터 디렉토리 생성
# server1, server2에서 실행
sudo mkdir -p /usr/local/zookeeper/data
sudo mkdir -p /usr/local/zookeeper/logs

# server1의 경우, data2, logs2도 생성
sudo mkdir -p /usr/local/zookeeper/data2
sudo mkdir -p /usr/local/zookeeper/logs2

# Zookeeper 디렉토리 사용자 그룹 변경
sudo chown -R $USER:$USER /usr/local/zookeeper

zoo.cfg

server1, server2 모두 실행해주세요.

cp /usr/local/zookeeper/conf/zoo_sample.cfg /usr/local/zookeeper/conf/zoo.cfg

아래 내용 수정 후 저장.

tickTime=2000
initLimit=10
syncLimit=5
dataDir=/usr/local/zookeeper/data
dataLogDir=/usr/local/zookeeper/logs
clientPort=2181

server.1=server1:2888:3888
server.2=server1:2889:3889
server.3=server2:2888:3888

server1에서만 추가로 설정. server 1에서는 zookeeper를 2대 설정해야 하므로, zoo.cfg와 zoo2.cfg로 설정파일을 2개 만들어준다.

cp /usr/local/zookeeper/conf/zoo_sample.cfg /usr/local/zookeeper/conf/zoo2.cfg

아래 내용 수정 후 저장.

tickTime=2000
initLimit=10
syncLimit=5
dataDir=/usr/local/zookeeper/data2
dataLogDir=/usr/local/zookeeper/logs2
clientPort=2182

server.1=server1:2888:3888
server.2=server1:2889:3889
server.3=server2:2888:3888

myid 설정

# myid 파일 각각 편집
# 아래 내용 수정 후 저장(server1 - 1, 2/ server2 = 3 설정)
## server 1
sudo vim /usr/local/zookeeper/data/myid
1

sudo vim /usr/local/zookeeper/data2/myid
2

## server 2
sudo vim /usr/local/zookeeper/data/myid
3

Hadoop 실행

# server1 zookeeper 실행
/usr/local/zookeeper/bin/zkServer.sh start zoo.cfg
/usr/local/zookeeper/bin/zkServer.sh start zoo2.cfg

# server2 zookeeper 실행
/usr/local/zookeeper/bin/zkServer.sh start zoo.cfg


# server1 zookeeper 초기화
![](https://velog.velcdn.com/images/suran/post/9469eac0-e81e-47f8-9506-e67b01654bd8/image.png)
hdfs zkfc -formatZK

# server1 journalnode 실행
hdfs --daemon start journalnode

# server2 journalnode 실행
hdfs --daemon start journalnode

# server1
hdfs namenode -format

# server1 journalnode 초기화
hdfs namenode -initializeSharedEdits

# server1의 NN, zkfc 실행 (server1 Active로 사용)
hdfs --daemon start namenode
hdfs --daemon start zkfc

# server1 datanode 실행
hdfs --daemon start datanode

# server2의 NN, zkfc 실행
hdfs namenode -bootstrapStandby
hdfs --daemon start namenode
hdfs --daemon start zkfc

# server2 datanode 실행 
hdfs --daemon start datanode