Pandas 기본 1

Chanyang Im·2021년 7월 22일
0

Python

목록 보기
8/16
post-thumbnail

Pandas란

데이터를 효과적으로 처리하고, 보여줄 수 있도록 도와주는 라이브러리입니다.

인덱스(Index)에 데이터를 나열하고, 시리즈(Series)를 기본적인 자료형으로 사용합니다.

Pandas의 기본개념

Series

인덱스(Index)와 값(value)로 구성됩니다.

# pandas 불러오기 및 pd로 사용하기
import pandas as pd

array = pd.Series(['사과', '바나나', '당근'], index =['a', 'b', 'c'])

# 시리즈 출력 
print(array)
# 인덱스 a에 해당하는 값 출력
print(array['a'])

결과

Dicktionary 자료형을 Series로 바꾸기

data = {
    'a': '사과',
    'b': '바나나',
    'c': '당근'
}

array = pd.Series(data)
print(array)
print(array['a'])

결과

데이터 프레임

다수의 시리즈(Series)를 모아서 처리하기 위해서 사용합니다.

표 형태로 데이터를 손쉽게 출력하고자 할 때 사용합니다.

word_dict = {
    'Apple': '사과',
    'Banana': '바나나',
    'Carrot': '당근'
}

frequency_dict = {
    'Apple': 3,
    'Banana': 5,
    'Carrot': 7
}

word = pd.Series(word_dict)
frequency = pd.Series(frequency_dict)

summary = pd.DataFrame({
    'word': word,
    'frequency':frequency
})

print(summary)

결과

profile
안녕하세요!! 세상에 관심이 많은 공학자입니다!😆

0개의 댓글