데이터마트(Data Mart), 데이터웨어하우스(Data Warehouse), 데이터 레이크(Data Lake)

oneofakindscene·2021년 8월 4일
0

CS

목록 보기
7/8

  • 데이터베이스를 가르키는 3가지 스타일: Data Mart, Data Warehouse, Data Lake
  • 데이터 소매점(Data Mart), 데이터 도매점(Data Warehouse)

데이터 마트(Data Mart)

  • Data Mart(이하 DM)은 현업에서 데이터를 활용하는 담당자가 데이터를 활용하기 위한 형태 거의 그대로 데이터를 쌓아두는 공간이다.
  • 각 현업에서 사용하는 업무단위 처럼 상세한 단위로 데이터를 저장하고, 사용한다.

데이터 웨어 하우스(Data Warehous)

  • Data Warehouse(이하 DW)는 데이터 소매점(DM)에 공급하게될 데이터를 다양한 원천에서 수집하여 주제별로 저장하는 데이터 도매점과 같은 공간이다.
  • 즉 다양한 원천에서 발생하는 데이터를 소비자에게 전달하기 전에 "통합"하여 저장하는 공간이라고 할 수 있다.
  • 그런데 다양한 원천에서 발생하는 데이터는 발생 지점의 환경에 따라 서로 다른 구조(스키마)나 데이터에 사용된 용어(동음이의어/이음동의어)등의 문제가 야기된다.
  • DW는 이러한 문제들을 전사적 관점에서 고려하여 다양한 데이터를 통합저장하는 구조로 설계되고 구축된다.

    단, DW 스타일에서는 통합되는 과정에서 데이터를 정제하는 비용과 버려지는 데이터가 발생한다. 이러한 점이 Data Lake의 등장이 야기되는 지점이다.

데이터 레이크(Data Lake)

Data Lake(이하 DL)은 다양한 원천을 하나의 통합된 형태로 정제한 DW와 달리, 다양한 원천을 그대로 가져와 저장하여 다양성을 보존하는 스타일을 가지고 있다.

즉, DL은 원천에서 발생한 데이터를 다양한 형태 그대로 한 곳에 저장하는 공간이라고 할 수 있다.

References

profile
oneofakindscene

0개의 댓글