[TIL 23일차] 데브코스 데이터엔지니어링

heering·2023년 5월 10일
0

GROUP BY

SELECT
	LEFT(ts, 7) AS mon,
    COUNT(1) AS session_count
FROM raw_data.session_timestamp
GROUP BY 1 -- GROUP BY mon, GROUP BY LEFT(ts, 7)
ORDER BY 1; -- SELECT 문에서 첫 번째니까 ORDER BY mon;

JOIN

  • JOIN 앞에 아무것도 안 쓰면 INNER JOIN이라는 뜻

CTAS: SELECT를 가지고 테이블 생성

  • 간단하게 새로운 테이블을 만드는 방법
  • 자주 조인하는 테이블들이 있다면 이를 CTAS를 사용해 조인해두면 편리

NULL 값 있나 체크하는 방법

아래는 이미 예시 테이블이 있는 상태에서 진행한 것이다.

%%sql

SELECT
    COUNT(CASE WHEN sessionId is NULL THEN 1 END) sessionid_null_count,
    COUNT(CASE WHEN userId is NULL THEN 1 END) userid_null_count,
    COUNT(CASE WHEN ts is NULL THEN 1 END) ts_null_count,
    COUNT(CASE WHEN channel is NULL THEN 1 END) channel_null_count
FROM adhoc.heewon_session_summary;

0개의 댓글