집계 – aggregate
relplot – 연속된 관계 데이터, 중간에 끊어질 수 있음
데이터가 대용량일 경우
시도명을 코드명으로 쓰는 이유
-> 데이터 용량을 줄이거나 인코딩 에러 방지
피어슨 상관계수
문자열 데이터를 딕셔너리로 나누는 방법
->
age_list = age_code.split("\n")
age_dict = {int(i.split(" ")[0].strip()):i.split()[1].strip() for i in age_list}
age_dict
빈도수, 평균, 표준편차, 최솟값, 1사분위수(25%), 2사분위수(50%, 중앙값), 3사분위수(75%), 최댓값
'count', 'mean', 'std', 'min', '25%', '50%', '75%', 'max’
상관관계의 정도를 파악하는 상관 계수는 두 변수 간의 연관된 정도를 나타낼 뿐 인과 관계를 설명하는 것은 아니다.
SELECT *
FROM TABLE_A
INNER JOIN TABLE_B ON TABLE_A.Id = TABLE_B.Id
-LEFT JOIN : 왼쪽 테이블을 기준으로 왼쪽 테이블의 데이터를 다 끌어오고 오른쪽 테이블의 데이터들은 있는 것만 끌어옴
SELECT *
FROM TABLE_A
LEFT JOIN TABLE_B ON TABLE_A.Id = TABLE_B.Id
-RIGHT JOIN : 오른쪽 테이블을 기준으로 오른쪽 테이블의 데이터를 다 끌어오고 왼쪽 테이블의 데이터들은 있는 것만 끌어옴
SELECT *
FROM TABLE_A
LEFT JOIN TABLE_B ON TABLE_A.Id = TABLE_B.Id
NULL값을 찾을 때는 =
말고 IS
를 사용
-SELF JOIN
자기 자신을 조인
SELECT Employee.Name AS Employee
FROM Employee
INNER JOIN Employee as Manager ON Employee.managerid = Manager.id
WHERE Employee.Salary > Manager.Salary
SELECT DATE_ADD(NOW(), INTERVAL 1 SECOND)
SELECT DATE_ADD(NOW(), INTERVAL 1 MINUTE)
SELECT DATE_ADD(NOW(), INTERVAL 1 HOUR)
SELECT DATE_ADD(NOW(), INTERVAL 1 DAY)
SELECT DATE_ADD(NOW(), INTERVAL 1 MONTH)
SELECT DATE_ADD(NOW(), INTERVAL 1 YEAR)
SELECT DATE_ADD(NOW(), INTERVAL 1 –YEAR)
SELECT DATE_SUB(NOW(), INTERVAL 1 SECOND)