>⛹️♀️ 제로베이스 데이터취업스쿨 15기 스터디노트 29(6.15.)
🗂️ 오늘(6.14.) 수강한 분량
SQL 8~9, EDA 학습과제 1 제출
🗂️ SQL 8~9 핵심 내용 정리
IN 문법
- 목록 안에 조건이 존재하는 경우
SELECT column1,column2 ... FROM tablename; WHERE column IN (value1, value2, value3 ...);
LIKE 문법
- 조건값이 패턴에 맞으면 TRUE
SELECT column1,column2 ... FROM tablename; WHERE column LIKE pettern;
🗂️ EDA 학습과제 1 힌번 더 다시 보기
1단계 DataFrame 불러오기&전처리
- index의 row를 제거, index 초기화
df_target.drop(index = [ ]) #데이터 제거 data.reset_index(drop=True) #초기화
- 천단위 구분자 제거, data type 변경
datas['세대'][n] = datas['세대'][n].replace(',','') #천단위 제거 datas_i = datas.astype({"세대":int,}) #데이터타입 변경 ★여기 오답으로 체크되어서 나중에 확인해봐야 할 것
2. 원하는 정보 얻기
- 권역 구분
datas_i.insert(loc=2, column='권역', value=('도심권', '도심권', '도심권', '동북권', '동북권', '동북권', '동북권', '동북권', '동북권', '동북권', '동북권', '서북권', '서북권', '서북권', '서남권', '서남권', '서남권', '서남권', '서남권', '서남권', '서남권', '동남권', '동남권', '동남권', '동남권')) → 이거 말고 다른 반복문을 쓰는 방법도 있었을텐데 궁금하다
3. 시각화
- pie차트 시각화
import matplotlib.pyplot as plt value = p_pop["등록외국인 계"] name = p_pop["등록외국인 계"] plt.pie(p_pop["등록외국인 계"], labels=p_pop.index) plt.legend(p_pop["등록외국인 계"])
👩🚀 스터디 감정 노트
과제 하나 클리어,,, 내일은 과제데이다ㅎㅎㅎ
모르는게 있어서 이것저것 찾아보고 확인하면서 하는데도 틀리는게 있어서 어디가 문제인지 더 효율적인 방법은 없는지 궁금하다🤯보면서 하는것도 한계에 다다른 나의 뇌,,,🤯