import pandas as pd
Series
: 모든 유형의 데이터를 보관하는 1차원 배열DataFrame
: 행과 열이 있는 테이블과 같은 데이터를 보관하는 2차원 배열#In
s = pd.Series([1,2,3,4,5])
#Out
0 1
1 2
2 3
3 4
4 5
dtype: int64
Numpy
를 사용하여 DataFrame
생성import numpy as np
#In
number = [1,2,3,4,5,6]
df = pd.DataFrame(np.random.randn(6,4), index=number, columns=list('ABCD'))
#Out
A B C D
1 -0.713372 0.487297 0.175619 1.126466
2 -2.031435 0.338329 0.047565 0.239074
3 1.197670 -0.361998 -0.247807 -1.301809
4 -0.162813 0.635130 0.497010 -1.128038
5 0.986570 0.801526 -0.835925 0.173154
6 -1.369150 -0.034347 0.027706 -0.928288
✅ np.random.randn(6,4)를 사용하여 무작위 숫자로 데이터를 채움
✅ index=number : index를 number라는 리스트로 생성
✅ columns=list('ABCD') : 'ABCD'라는 문자열을 list로 변환하여 columns 생성
딕셔너리
를 사용하여 DataFrame
생성#In
df2 = pd.DataFrame({'A' : 1,
'B' : ["test1", "test2", "test3"],
'C' : pd.Series(2, index=list(range(3)), dtype='float32')})
#Out
A B C
0 1 test1 2.0
1 1 test2 2.0
2 1 test3 2.0
✅ A : 1이라는 정수를 가진 열 생성
✅ B : "test1", "test2", "test3" 문자열을 가지는 열 생성
✅ C : 2라는 실수를 가진 열 생성 ( 인덱스는 0, 1, 2 데이터 형식은 float32로 지정된 시리즈로 생성 )