[Hive] Hive는 꼭 MapReduce로 동작할까?

최지영·2022년 8월 16일
0

Apache Hive는 꼭 MapReduce로 동작할까❓

하이브가 동작할때 MapReduce 기반으로 동작한다고 하지만 쿼리에 따라서 다르게 동작한다.

예를 들어 아래와 같이 단순하게 테이블만을 조회하는 쿼리는 MapReduce로 동작하지 않고 하이브가 테이블로 부터 레코드를 읽어서 형식에 맞춰 콘솔에 출력해준다

SELECT* from test_tbl;

하지만 쿼리에 아래와 같은 집계나 연산( min/max /count/ groupby) 등 이 들어가는 순간 실행한 쿼리는 MapReduce로 동작한다

예)

SELECT count(*),seq from test_tbl group by seq

하지만 이러한 MapReduce를 사용하게 하는 쿼리도 로컬모드로 실행하게 해줄 수 있는 설정을 Hive에서 해줄 수 있는데 이는 다음 아래 설정과 같다

hive.exec.mode.local.auto=true;

0개의 댓글