회사 면접 시에 질문하면 좋은 것: 사용하고 계신 데이터 웨어하우스 기술이 무엇인가요.
Data drift 현상 해결하기 위해 나온 것이 MLOps
데이터가 커지면 테이블과 대시보드의 수가 증가 → 데이터 분석 시에 어느 테이블이나 대시보드를 봐야하는지 혼란 생김 → 그러면 또 새로운 테이블이나 대시보드를 또 만들어냄 (😕..) → 정보 과잉 문제가 더 심해짐
기본적으로 클라우드가 대세.
ETL | ELT |
---|---|
데이터 레이크 & 데이터 웨어하우스 바깥 → 안으로 데이터를 가져옴 | 데이터 레이크와 데이터 웨어하우스 안에 있는 데이터를 처리함 |