02. Spark History Server

JAMM·2023년 3월 29일
0

Spark

목록 보기
3/5
post-thumbnail

Spark History Server 구성

Log Directory 설정 for Spark History Server

$ cd /{base_dir}/spark3/conf
$ cp spark-defaults.conf.template spark-defaults.conf
$ vi spark-defaults.conf
spark.history.fs.logDirectory file:///{base_dir}/spark3/history
$ mkdir -p /{base_dir}/spark3/history

Log Directory 설정 for Spark Application

vi /{base_dir}/spark3/conf/spark-defaults.conf
spark.eventLog.enabled true
spark.eventLog.dir file:///{base_dir}/spark3/history

Spark History Server Start

$ /{base_dir}/spark3/sbin/start-history-server.sh
$ jps


Spark History Server Web UI 확인

  • 필요 시, 18080 port에 대해서 방화벽 오픈 필요
  • spark session이 종료되더라도 spark history server web ui에서 정상적으로 종료된 spark application과 비정상적으로 종료된 spark application 모두 확인할 수 있다.

Spark History Server Log Directory 확인

  • 앞서 spark_defaults.conf에 Spark History Server에 Log가 기록되는 default path와 모든 Spark Application에 대한 Log 또한 Spark History Server의 default path에 쌓이도록 설정함
  • 현재 진행중인 Spark Application의 Log는 ~.inprogress로 끝나게 되고 정상적으로 종료되면 ~.inprogress가 없이 Log가 저장되어서 Spark History Server에서는 현재 실행중이지 않은 또는 이전에 실행되었던 모든 Spark Application에 대한 로그를 볼 수 있다.

0개의 댓글