1. ETL 기초 실습 1-1. ETL 개념 데이터 파이프라인의 기능 추출 (Extracting) 변환 (Transforming) 결합 (Combining) 검증 (Validating) 적재 (Loading) ETL이란 데이터 파이프라인의 기능 중 추출, 변환, 적
Airflow.cfg > 💡 Windows기반 Docker 사용 시 airflow.cfg 파일 접근, 수정 방법 Docker GUI 실행 docker-webserver 컨테이너 클릭 Files 탭 클릭 opt > airflow > airflow.cfg Airflow
멱등성 한 번 수행, 여러 번 수행한 결과가 같다. (ex:어떤 수에 1을 곱하는 연산은 여러 번 수행해도 처음 수행과 결과가 같으므로 멱등하다.) 데이터 파이프라인이 연속 실행되었을 때 소스에 있는 데이터가 그대로 DW로 저장되어야함을 이야기 (소스 데이터 = DW
'멱등하다.' : 한 번 수행한 것과 여러 번 수행한 결과가 같다.어떤 수에 1을 곱하는 연산은 여러 번 수행한 결과가 처음 수행한 결과와 같으므로 멱등하다.절대값 함수는 같은 값에 대해 여러 번 수행한 결과가 처음 수행한 결과와 같으므로 멱등 함수이다.데이터 파이프라
1. Docker 설치 https://docs.docker.com/engine/install/ 이후 터미널에서 다음 명령어로 설치를 확인한다. 2. Airflow 설치 폴더(DE-Airflow) 생성, 이동 터미널을 관리자 권한으로 실행 후 폴더 경로로 이동한다.
데이터 파이프라인 (=ETL, 크게 보면 ELT) 데이터 프로세싱을 위해 실행하는 코드 ETL: Extract, Transform and Load Data Pipeline, ETL, Data Workflow, DAG <- 다 동일어 ETL (Extract, Trans
summary table (=ELT) summary table은 밑단 테이블(콜센터 솔루션 등)이 바뀌더라도 그 내부를 알아야 할 필요가 없기 때문에 유용하다. 써머리 테이블만 대시보드, 데이터 분석 등에 사용 (Looker) Being consistent is mor
테이블 정보 sessiontimestamp와 usersession_channel은 sessionid를 기준으로 1:1 관계 usersessionchannel과 sessiontransaction은 N:1 관계. 즉, 유저는 거래 세션을 포함한 여러 세션을 가질 수 있고
SQLPythonAirflowETL/ELT 관리도구 AirflowETL : 바깥에서 데이터 가져오기 -> 데이터 엔지니어의 역할ELT : 내부 데이터를 재조합하기AWS프로덕션 데이터베이스는 mysql postgre 등을 사용, 서비스 운영에 필요한 필수적인 데이터 저장
📌 error📌 solutionMySQL Workbench 상단의 Edit -> Preferences -> SQL EditorMySQL Session 란에서 시간을 늘려주기
Redash 설치 참고 자료 https://velog.io/@vive0508/redash-on-docker docker 설치 참고 자료 https://velog.io/@hanjuli94/%EC%9C%88%EB%8F%84%EC%9A%B0%EC%97%90%EC%84%9C
📌 error📌 solution
vscode의 terminal에서 다음 명령어를 실행했을 때, 아래와 같은 오류가 발생했다.이는 window환경에서 "docker desktop"을 실행하지 않고 docker 명령어를 사용했을 때 발생하는 오류이다.
1. $\hat\beta_1$ 가설검정 다음의 가설검정을 생각해보자. 표준오차 $S.E(\hat\beta_1)$ : 표본 통계량의 표준 편차 $T$-통계량 : 모집단의 분산이나 표준편차를 알지 못할 때, 모집단을 대표하는 표본으로부터 추정된 분산이나 표준편차를 가
📌 문제https://school.programmers.co.kr/learn/courses/30/lessons/13220112세 이하인 여자환자의 환자이름, 환자번호, 성별코드, 나이, 전화번호를 조회전화번호가 없는 경우, 'NONE'으로 출력시켜 주시고 결
📌 문제https://school.programmers.co.kr/learn/courses/30/lessons/59405가장 먼저 들어온 동물의 이름을 조회하는 SQL 문을 작성해주세요.📌 정답💡포인트LIMIT 1 : 상위 1개LIMIT 0, 9 : 0번
📌 문제https://school.programmers.co.kr/learn/courses/30/lessons/59037젊은 동물의 아이디와 이름을 조회하는 SQL 문을 작성해주세요. 이때 결과는 아이디 순으로 조회해주세요.📌 정답💡포인트NOT LIKE
📌 문제https://school.programmers.co.kr/learn/courses/30/lessons/133025상반기 아이스크림 총주문량이 3,000보다 높으면서 아이스크림의 주 성분이 과일인 아이스크림의 맛을 총주문량이 큰 순서대로 조회하는 SQ
📌 문제https://school.programmers.co.kr/learn/courses/30/lessons/59036아이디와 이름을 조회결과는 아이디 순서📌 정답💡 질문과 피드백 사항은 댓글에 편하게 남겨주시기 바랍니다.❤️ 도움이 되셨다면 공감 부탁
📌 문제https://school.programmers.co.kr/learn/courses/30/lessons/131537📌 정답📌 시행착오💡포인트NULL AS USER_ID : NULL 빈 열 추가DATE_FORMAT(SALES_DATE, '%Y-%m