인프런 - 데이터 분석을 위한 판다스 - 섹션 1 - 판다스의 자료구조 : 데이터프레임과 시리즈

르네·2023년 10월 2일
0

Python

목록 보기
22/45

본 내용은 인프런 강의 <데이터 분석을 위한 판다스>를 수강하며 중요한 점을 정리한 글입니다.

판다스 튜토리얼
https://pandas.pydata.org/pandas-docs/stable/getting_started/intro_tutorials/index.html

1. What kind of data does pandas handle?

판다스에서 데이터를 담는 자료구조 2가지

-> 데이터 프레임, 시리즈

  • 데이터 프레임
    : 판다스에서 테이블 데이터는 데이터 프레임이라고 부른다. 행과 열을 가지고 데이터를 2차원으로 표현한다.

  • 시리즈
    : 데이터 프레임에서 한 컬럼을 선택하거나 또는 한 줄 데이터의 경우 시리즈라고 부른다. 1차원으로 데이터를 관리한다.

  • 테이블 데이터에서는 각 행은 데이터 하나를 의미하고, 각 열은 이 데이터의 특성을 표시해준다.

  • 노란색 형광펜 한 곳 -> 인덱스
    : row(행)의 라벨

실습)

데이터 프레임 만들기

import pandas as pd

name = ['Braund', 'Allen', 'Bonnell']
age = [22, 35, 58]
sex = ['male','male', 'female']

data = {'Name': name, 'Age' : age, 'Sex' : sex}

df = pd.DataFrame(data)

시리즈 만들기

시리즈가 여러 개가 뭉쳐서 데이터프레임이 된다.

간단한 연산

  • df.describe()
    : df 데이터프레임에 있던 데이터 중에서 숫자로 표현할 수 있는 데이터에 대한 기술통계량(평균, 표준편차, 최솟값, 중앙값, 최대값 등)을 보여줌.
profile
데이터분석 공부로그

0개의 댓글