[TIL 33일차] 데브코스 데이터엔지니어링

heering·2023년 5월 24일
0

AWS Redshift Spectrum

Redshift 확장 기능, S3에 있는 파일들을 테이블처럼 SQL로 처리 가능
사용하려면 Redshift 클러스터가 필요하고, S3와 Redshift 클러스터가 같은 region에 있어야 함

AWS Athena

AWS의 Presto 서비스. Redshift Spectrum과 비슷한 기능을 제공
S3에 있는 데이터들을 기반으로 SQL 쿼리 기능 제공

AWS Redshift ML

SQL만 사용해서 ML 모델을 훈련하고 사용할 수 있게 해주는 기능 (우와 😮)
AWS SageMaker에 의해 지원되며, 이미 모델이 만들어져 있다면 이를 사용하는 것도 가능함

Fact 테이블 VS Dimension 테이블

  1. Fact 테이블
    분석의 초점이 되는 양적 정보를 포함하는 중앙 테이블
    보통 매출 수익, 판매량 등과 같은 사실/측정 항목 포함. 비즈니스 결정에 사용됨

  2. Dimension 테이블
    Fact 테이블에 대한 상세 정보를 제공하는 테이블
    보통 고객, 제품과 같은 테이블로 Fact 테이블의 상세 정보 제공
    Primary Key 가지며, Fact 테이블의 Foreign key에서 참조

0개의 댓글