[Pandas] pandas란

cybergangster·2022년 6월 20일
0

Pandas

목록 보기
7/20
post-thumbnail

Pandas 공식 문서
https://pandas.pydata.org/docs/index.html

빠르고 유연한 데이터 구조를 제공하는 Python 라이브러리 패키지로,
Pandas는 관계형 또는 레이블이 된 데이터로 쉽고 직관적으로 작업할 수 있도록 설계되었다.
강력하고 유연한 오픈소스 데이터 분석 도구로,
Numpy 기반에서 개발되어 Numpy를 사용하는 어플리케이션에서 쉽게 사용이 가능하다.
아나콘다에서 기본적으로 제공되지만, 아나콘다를 사용하지 않을 경우에는

pip install pandas

를 통해 설치 후 사용이 가능하다.

  • 모듈 임포트

    import pandas (as pd)

  • 버전 확인

    pandas.__version__
    혹은
    pd.__version__


[자료구조]

  • 시리즈(Series) : 1차원, 1차원 리스트와의 차이점은 인덱스 이름을 부여할 수 있다는 점.
  • 데이터프레임(DataFrame) : 2차원, 행과 열이 있고 인덱싱 및 슬라이싱은 시리즈와 동일하게 사용 가능.
  • 패널(Panel)

모든 자료구조는 인덱스(Index)를 가지고 있다.
pandas의 인덱스는 리스트에서 사용하는 순서를 나타내는 숫자 인덱스와
사전형에서 사용하는 key 인덱스를 모두 포함하고 있다.



0개의 댓글