[SQL-TUNING] 테이블 엑세스 최소화 (2)

이승환·2022년 3월 30일

Sql-tuning

목록 보기

4/8

이번 챕터는 인덱스 스캔 과정에 대해서 알아보고, 인덱스 스캔의 효율성을 높이는 방안에 대해서 설명한다.
사전지식으로 카디널리티 에 대해 간단하게 알아보고 넘어가자

CREATE INDEX idx_localtion_first ON users(location, name, id)
CREATE INDEX idx_id_first ON users(id, name, location)

위 2가지의 인덱스 방법 중에서 어떤 인덱스 방식이 나을까?
지역(LOCATION)의 경우 상대적으로 카디널리티가 낮고, ID의 경우 카디널리티가 높다.
앞선 포스팅에서 인덱스는 b+ tree 구조로 저장되어있으며, 수직탐색 + 수평탐색 + 랜덤 I/O를 최소화 하는 것이 이득이라고 했다.
결과적으로 카디널리티가 높은 ID를 선행 인덱스 칼럼으로 두는 것이 효과가 더 좋다.
왜냐하면 트리구조에서 비교연산이 들어갈 터인데, 정렬되어있는 인덱스 트리에서 더 확실한 값을 기준으로 하여 수직탐색을 하는 것이 가장 적게 인덱스 트리 탐색을 진행하기 때문이다.

IN 리스트는 후보 리스트 들 중에서 (=)와 같은 등치를 진행하는 것이 맞긴 하다.
하지만 인덱스 칼럼들 구성과 조건절에 따라 오히려 좋지 않은 결과를 보여줄 때가 있다.
예를 들어 정렬된 리스트 들 중에서, 리프노드에서 IN LIST를 활용하면, 클러스터링이 잘 되어있는 경우 블록접근이 더욱 빠르게 연산되는 경우가 있다.
하지만 루트노드나 브랜치에서 IN LIST를 활용한다면 수직, 수평 접근이 많아지기도 한다.
INDEX SKIP RANGE SCAN을 활용하는 것과 비슷한 방법으로 활용하는 것이 좋다.

Mechanical & Computer Science