[TIL 10일차] 데브코스 데이터엔지니어링

heering·2023년 4월 21일
0

TIL 10일차

1. Seaborn

  • pip install seaborn, import seaborn as sns
  • ~.lineplot(): 꺾은 선 그래프, x축과 y축 명시
  • ~.barplot(): 막대 그래프, x축과 y축 명시
  • seaborn은 matplotlib 기반으로 만들어짐
  • import matplotlib.pyplot as plt
  • plt.title('제목'): 제목 설정
  • plt.xlable('제목'): x축, y축 레이블 설정
  • plt.ylim(n, m): y축의 범위를 n~m까지로 설정
  • plt.figure(figsize=(n, m)): 출력되는 그림 크기를 nXm으로 지정

2. 스크래핑 결과 시각화

  • 바로 못 읽어오면 implicitly_wait 활용하기

  • 기상청 온도 긁어온 뒤 간단한 시각화 실습

  • dictionary에서 상위 몇 개만 뽑아내려면 Counter 활용

'''여기서 dic은 dict'''
from collections import Counter
counter = Counter(dic)
counter.most_common(10) # 결과는 이렇게 [('python', 234), ...]
  • 프로그래머스 QnA 페이지 질문 Tag 빈도수 시각화 실습

3. Word Cloud

  • 형태소 분석 라이브러리 %pip install konlpy 후에, from konlpy.tag import Hannanum 사용

  • Colab에서 한글 출력 깨짐 문제는 여기를 참고해서 해결. 애국가 명사 Word Cloud 실습

  • 프로그래머스 QnA 1-10페이지 제목의 명사 Word Cloud 실습

중간에 ㅠㅠ 있는 거 귀엽다 😆

0개의 댓글