EMR(Elastic MapReduce)란?
AWS에서 제공하는 완전관리형 빅데이터 플랫폼
하둡, 스파크, Hive, 제플린 등 오픈소스 프레임워크를 가지고 클러스터를 쉽게 구축해주는 서비스이다
단계별로 클러스터에 작업을 제출하는 기능으로 확인된다
하드웨어 단계에서는 일단 기본값 설정 그대로 사용한다
EMR 설정이 마무리가 되면, 실습을 위한 Zeppelin 사용을 위해 Application user interface의 연결을 설정해준다
화면에 나온대로 터미널을 입력하면 되지만, 맨 처음 마스터 노드에 접속하고자 하면 SSH 에러가 발생한다.
터미널에,sudo nano /etc/ssh/sshd_config
를 입력한 뒤,
PasswordAuthentication
을 yes로,
ChallengeResponseAuthentication
을 no로 설정한 뒤 웹 연결 설정을 다시 하면 서버가 켜지는 것을 확인할 수 있다.
이제 가동중인 EMR의 애플리케이션을 모두 사용할 수 있다