파이썬 탐색적 데이터 분석

매일 공부(ML)·2022년 2월 5일
0

학습 목표

  • 파이썬의 탐색적 데이터 분석과 관련된 도구에 대해 알아봅니다.

핵심 키워드

  • 수치 계산을 위한 numpy

  • 데이터 분석을 위한 pandas

  • pandas의 DataFrame, Series

  • 데이터 시각화를 위한 matplotlib, seaborn


Numpy

참고 사이트: https://numpy.org/

  • 파이썬의 대표적인 수치계산 도구

  • Pyhon의 과학 컴퓨팅을 위한 기본 패키지

  • 다차원 배열 객체에 대한 빠른 작업

  • 내부에서 사전 파일된 C코드로 작성

  • 벡터화된 코드는 더 간결하고 읽기 쉬움

  • 코드 양이 적어 일반적으로 버그가 적다

  • 수학적 표기법과 더 유사한 코드로 수학적 구조를 더 쉽게 코딩 가능

  • 비효율적이고 읽기 어려운 for루프 대신 파이써닉한 코드 사용 가능


Pandas(Python Data Analysis)

  • 파이썬의 대표적인 데이터 분석 도구

  • Panel은 다차원 구조의 데이터 의미

  • Panel시스템을 위해서 개발됨

  • 데이터 타입

*예시

*표로 정리


Matplotlib & Seaborn

  • 데이터 시각화 도구

*그림

  • Matplotlib

    • 파이썬의 대표적인 시각화 도구
    • 원하는 대부분의 시각화 가능
    • 사용법이 복잡
    • 참고 사이트: https://matplotlib.org/

  • Seaborn

    • matplotlib의 고수준 인터페이스 제공
    • 사용하기 쉬움
    • 통계적 연산 제공
    • 참고 사이트: https://seaborn.pydata.org/
profile
성장을 도울 아카이빙 블로그

0개의 댓글