Data Warehouse

Volc·2024년 1월 10일
0

Data Engineer

목록 보기
1/2

Data Warehouse란?

  • 줄임말로 DW라고도 한다.
  • 다양한 소스에서 얻은 대량의 데이털르 연결, 통합하는 디지털 storage 시스템이다.

무엇을 저장하는가?

  • 정형데이터뿐이 아닌 비정형데이터도 저장하여 검색, 분석을 할 수 있도록 한다.

Warehouse vs Database

  • DB는 특정 사업 영역의 데이터를 저장한다.
  • DW는 전체 비즈니스에 대한 현재 및 과거 데이터를 저장하고 BI와 분석을 제공한다.
  • DW는 DB 서버를 사용하여 데이터를 가져오고 데이터 모델링, 수명주기 관리, 데이터 소스 통합 등을 위한 추가 기능을 제공한다.
  • DW는 DB의 상위호환 느낌이다.

Warehouse vs Data lake

  • DW는 특정 목적으로 서식이 지정된 데이터가 저장된다.
  • DL은 아직 정의되지 않은 원시 상태의 데이터를 저장한다.
  • 비즈니스 질문에 답하기 위해 데이터 레이크를 사용하기도 한다.
  • DW는 가공이 된 것, DL은 원시 상태를 유지한다.

Warehouse vs Data mart

  • DM은 데이터 웨어하우스의 하위 섹션으로 영업, 마케팅, 재무 등으로 사업부를 위해 분할되어 있다.
  • DW가 기업 전반의 중앙 데이터 스토리지 역할을 하며 DM은 일부 선택된 사용자 그룹에게 관련 데이터를 제공한다.

구성요소

  • 중앙 데이터베이스
    • 인메모리 DB가 인기이다.
  • ETL
  • 메타데이터
  • 액세스
    • application, OLAP, mining tool 등이 있다.

참고 사이트

https://www.sap.com/korea/products/technology-platform/datasphere/what-is-a-data-warehouse.html

profile
미래를 생각하는 개발자

0개의 댓글