분산 처리를 하기 위한 오프 소스 소프트웨어MapReduce(데이터 처리 모델), HDFS(데이터 저장 처리)를 사용클러스터의 다른 노드들에게 맵, 리듀스 Task할당Job : 수행작업 기본단위 \-> 각 task는 YARN을 통해 스케줄링 진행하둡은 master-
분산 처리를 하기 위한 오프 소스 소프트웨어MapReduce(데이터 처리 모델), HDFS(데이터 저장 처리)를 사용클러스터의 다른 노드들에게 맵, 리듀스 Task할당Job : 수행작업 기본단위 \-> 각 task는 YARN을 통해 스케줄링 진행하둡은 master-
하둡 Cluster 생성 > ### Hadoop On-premise생성 데이터 엔지니어링 수업 과정 중 Hadoop Spark수업을 진행하기에 앞서 희망하는 사람들을 대상으로 Hadoop전용 노트북을 받아서 클러스터를 생성 총 8대의 컴퓨터를 대여하여 Ubuntu22