[pandas] 10 minutes to pandas : Object creation

cosmos-JJ·2023년 10월 20일

Python

목록 보기

7/11

Object creation

import pandas

import pandas as pd

Basic data structures in pandas

Series : 모든 유형의 데이터를 보관하는 1차원 배열
DataFrame : 행과 열이 있는 테이블과 같은 데이터를 보관하는 2차원 배열

Creating a Series

list의 값으로 Series 생성

#In
s = pd.Series([1,2,3,4,5])

#Out
0    1
1    2
2    3
3    4
4    5
dtype: int64

2. Creating a DataFrame

Numpy를 사용하여 DataFrame 생성

import numpy as np

#In
number = [1,2,3,4,5,6]

df = pd.DataFrame(np.random.randn(6,4), index=number, columns=list('ABCD'))

#Out
            A	        B	       C           D
1	-0.713372	0.487297	0.175619	1.126466
2	-2.031435	0.338329	0.047565	0.239074
3	1.197670	-0.361998	-0.247807	-1.301809
4	-0.162813	0.635130	0.497010	-1.128038
5	0.986570	0.801526	-0.835925	0.173154
6	-1.369150	-0.034347	0.027706	-0.928288

✅ np.random.randn(6,4)를 사용하여 무작위 숫자로 데이터를 채움
✅ index=number : index를 number라는 리스트로 생성
✅ columns=list('ABCD') : 'ABCD'라는 문자열을 list로 변환하여 columns 생성

딕셔너리를 사용하여 DataFrame 생성

#In
df2 = pd.DataFrame({'A' : 1,
                    'B' : ["test1", "test2", "test3"],
                    'C' : pd.Series(2, index=list(range(3)), dtype='float32')})

#Out

     A	    B	  C
0	1	test1	2.0
1	1	test2	2.0
2	1	test3	2.0