[제로베이스 데이터취업스쿨 15기] Part. 5 SQL 스터디노트 -29(6.15.) / EDA 학습과제 1 제출

DaHye CHOI·2023년 6월 15일
0

>⛹️‍♀️ 제로베이스 데이터취업스쿨 15기 스터디노트 29(6.15.)

🗂️ 오늘(6.14.) 수강한 분량

SQL 8~9, EDA 학습과제 1 제출

🗂️ SQL 8~9 핵심 내용 정리

IN 문법

  • 목록 안에 조건이 존재하는 경우
  • SELECT column1,column2 ... FROM tablename;
    WHERE column IN (value1, value2, value3 ...);

LIKE 문법

  • 조건값이 패턴에 맞으면 TRUE
    SELECT column1,column2 ... FROM tablename;
    WHERE column LIKE pettern;

🗂️ EDA 학습과제 1 힌번 더 다시 보기

1단계 DataFrame 불러오기&전처리

  • index의 row를 제거, index 초기화
    df_target.drop(index = [ ]) #데이터 제거
    data.reset_index(drop=True) #초기화
  • 천단위 구분자 제거, data type 변경
    datas['세대'][n] = datas['세대'][n].replace(',','') #천단위 제거
    datas_i = datas.astype({"세대":int,}) #데이터타입 변경
    ★여기 오답으로 체크되어서 나중에 확인해봐야 할 것 

2. 원하는 정보 얻기

  • 권역 구분
    datas_i.insert(loc=2, column='권역', value=('도심권', '도심권', '도심권', '동북권', '동북권', '동북권', '동북권', '동북권', 
    '동북권', '동북권', '동북권', '서북권', '서북권', '서북권', 
    '서남권', '서남권', '서남권', '서남권', '서남권', 
    '서남권', '서남권', '동남권', '동남권', '동남권', '동남권'))
    → 이거 말고 다른 반복문을 쓰는 방법도 있었을텐데 궁금하다

3. 시각화

  • pie차트 시각화
    import matplotlib.pyplot as plt
    value = p_pop["등록외국인 계"]
    name = p_pop["등록외국인 계"]
    plt.pie(p_pop["등록외국인 계"], labels=p_pop.index)
    plt.legend(p_pop["등록외국인 계"])

👩‍🚀 스터디 감정 노트

과제 하나 클리어,,, 내일은 과제데이다ㅎㅎㅎ
모르는게 있어서 이것저것 찾아보고 확인하면서 하는데도 틀리는게 있어서 어디가 문제인지 더 효율적인 방법은 없는지 궁금하다🤯보면서 하는것도 한계에 다다른 나의 뇌,,,🤯

profile
데이터가 궁금한 비전공자의 데이터스터디🫠

0개의 댓글