데이터 영역의 구분: OLTP와 OLAP를 기준으로

최건우·2023년 6월 4일
0

데이터의 구분

데이터는 성격과 목적에 따라 두 부류로 구분할 수 있다.

1. 거래 처리 영역(OLTP)에서의 데이터

  • OLTP: On-Line Transaction Processing
  • 온라인에서 발생한 트랜잭션을 데이터베이스에 저장한 데이터를 의미한다.

2. 분석 정보 생산 영역(OLAP)에서의 데이터

  • OLAP: On-Line Analytical Processing
  • 거래 데이터를 가공하여 분석 정보를 담은 데이터. 기업 운영에 필요한 의사 결정 관점에서, 거래 처리 데이터보다 더 큰 가치를 가진다.

거래 처리 영역과 분석 정보 영역은 서로 다른 목적을 가진다. 거래 처리 영역은 비즈니스 활동 자체를 지원한다. 반면, 분석 정보 영역은 비즈니스 활동에 대한 측정, 평가, 분석, 예측, 개선을 지원한다.

이처럼 데이터는 성격과 목적에 따라 두 가지로 나뉘며, 별도의 영역에서 관리한다. 용도와 목적이 다르기 때문에 데이터 모델링의 기준도 서로 다르게 가져가야 한다.

OLTP, OLAP 데이터 모델의 비교

OLTP

정규화된 테이블에 데이터가 실시간으로 빈번하게 입력, 수정, 삭제된다고 전제한다. 따라서 OLTP 영역 데이터 모델링에서 가장 중요하게 생각해야 하는 것은 정규화를 통한 중복 최소화, 무결성 극대화이다.

  • 목적: 비즈니스 활동(거래)의 원활한 지원, 트랜잭션의 원활한 처리
  • 트랜잭션 유형: insert, update, delete, select
  • 데이터 수명 주기: 실시간
  • 관리 단위: 정규화가 수행된 테이블
  • 시간성: 현재 데이터
  • 설계 기법: 정규화에 기반한 ER 모델링
  • 최적화 방향성: 데이터 갱신 효율성, 무결성 극대화

OLAP

거래 데이터를 기초로 효과적으로 분석하고 조회하는 것이 목적이다. OLAP 데이터 모델링 시 중요하게 생각해야 하는 것은 통합된 연관 정보를 효과적인 분석, 조회가 가능한 형태로 구조화하는 것이다.
이러한 특성 때문에, OLAP 데이터 모델은 때로는 OLTP 데이터 모델에 비해 정규화가 덜 된 형태이거나, 반정규화가 사용되었을 수도 있다.

  • 목적: 비즈니스 활동에 대한 평가, 예측
  • 트랜잭션 유형: select
  • 데이터 수명 주기: ETL 일정에 따른 주기
  • 관리 단위: 분석과 집계를 위한 관련 데이터들의 묶음
  • 시간성: 과거 데이터
  • 설계 기법: 디멘션 모델링
  • 최적화 방향성: 조회 성능, 사용성, 접근 편의성
profile
부족한 경험을 채우기 위한 나만의 기록 공간

0개의 댓글