여전히 SQL 기반의 관계형 DB
데이터 웨어하우스는 고객이 아닌 내부 직원을 위한 데이터베이스
ETL 혹은 데이터 파이프라인
외부에 존재(데이터 웨어하우스 밖에 존재)하는 데이터를 읽어다가 데이터 웨어하우스로 저장해주는 코드들이 필요해지는데 이를 ETL(Extrack - Transform - Load) 혹은 데이터 파이프라인이라고 부름.
ETL은 결국 코드임.
다양한 종류의 서버 타입 제공
세 가지 종류의 구매 옵션
SQL이 메인 언어!!
2PB까지 지원
Still OLAP
Columnar storage (컬럼 별 저장, 다른 DB들은 레코드 별 저장)
--> 컬럼별 압축 가능
--> 컬럼을 추가하거나 삭제하는 것이 아주 빠름.
Bulk Data 업데이트 지원
COPY
커맨드로 Redshift 테이블로 일괄 복사고정 용량 / 비용 SQL 엔진
다른 데이터 웨어하우스처럼 primary key uniqueness를 보장하지 않음
--> 중복된 데이터 저장 가능.
(프로덕션 데이터베이스들은 primary key를 보장)
PostgreSQL 8.x와 SQL이 호한됨.
Redshift Options and Pricing
CREATE SCHEMA
로 스키마 생성