[제로베이스 데이터 취업 스쿨]
▷ 오늘 학습 계획: SQL 학습과제
스타벅스 이디야 데이터 분석(SQL)
- AWS RDS 사용
- Database 생성, User 생성, User 권한, Table 생성
(PRIMARY KEY -> NOT NULL)- Python 예외처리
- Python 코드로 스타벅스, 이디야 데이터를 가져올때 Table에 바로 입력
- 입력된 데이터 조회
- 스타벅스, 이디야 매장 주요 분포 지역
(매장수가 많은 상위 5개 구이름, 매장 개수)- 구별 브랜드 각각의 매장 개수 조회
- 전체 데이터로 DataFrame 생성, CSV 파일로 저장
주유소 데이터 분석(SQL)
- 주유소 데이터를 저장할 Table 생성
- Python 함수 생성
- Python 코드로 주유소 데이터를 가져올때 Table에 바로 입력
- 입력된 데이터 조회
- 전체 데이터로 DataFrame 생성, CSV 파일로 저장
- 위도, 경도 정보를 이용하여 조건에 맞는 주유소 정보 조회하기
📝 과제 하면서 느낀점
- CASE WHEN, CROSS JOIN에 대해 알게됐고 st_distance_sphere 함수로 두 좌표 간의 거리를 구했다.
- table 생성할 때 type을 boolean으로 설정했는데 tinyint로 바뀌었다. 잘못된 건가 했는데 True는 1로, False는 0으로 넣으면 됐다.
- 페이지에서 데이터를 가져올 때 테이블에 바로 입력하는 과정이 생각보다 잘 안됐다. 반복문 중에 오타가 있었는데 그 작은 실수 때문에 데이터도 이상해졌고 어디가 잘못됐는지 찾는 시간도 길어졌다. 에러 때문에 테이블 데이터를 지웠더니 index number도 이상해져서 초기화했고, auto_increment 특징을 알 수 있었다.
- 가장 가까운 주유소 10개를 휘발유 가격이 저렴한 순으로 조회할 때 ORDER BY에 컬럼 2개를 넣으면 원하는 결과가 나오지 않아서 고민을 많이 했다.
- mysql에서 조회하면 column name이 다 보였는데 Python 코드로 DataFrame을 만들면 컬럼명이 다 숫자로 바꼈다. 이건 더 알아봐야겠다.
→ Cursor.description
▷ 내일 학습 계획: 통계 강의(기초 4~5)