[pandas] 10 minutes to pandas : Object creation

cosmos-JJ·2023년 10월 20일
0

Python

목록 보기
7/11

Object creation

import pandas

import pandas as pd

Basic data structures in pandas

  • Series : 모든 유형의 데이터를 보관하는 1차원 배열
  • DataFrame : 행과 열이 있는 테이블과 같은 데이터를 보관하는 2차원 배열

Creating a Series

  • list의 값으로 Series 생성
#In
s = pd.Series([1,2,3,4,5])

#Out
0    1
1    2
2    3
3    4
4    5
dtype: int64

2. Creating a DataFrame

  • Numpy를 사용하여 DataFrame 생성
import numpy as np

#In
number = [1,2,3,4,5,6]

df = pd.DataFrame(np.random.randn(6,4), index=number, columns=list('ABCD'))

#Out
            A	        B	       C           D
1	-0.713372	0.487297	0.175619	1.126466
2	-2.031435	0.338329	0.047565	0.239074
3	1.197670	-0.361998	-0.247807	-1.301809
4	-0.162813	0.635130	0.497010	-1.128038
5	0.986570	0.801526	-0.835925	0.173154
6	-1.369150	-0.034347	0.027706	-0.928288

✅ np.random.randn(6,4)를 사용하여 무작위 숫자로 데이터를 채움
✅ index=number : index를 number라는 리스트로 생성
✅ columns=list('ABCD') : 'ABCD'라는 문자열을 list로 변환하여 columns 생성


  • 딕셔너리를 사용하여 DataFrame 생성
#In
df2 = pd.DataFrame({'A' : 1,
                    'B' : ["test1", "test2", "test3"],
                    'C' : pd.Series(2, index=list(range(3)), dtype='float32')})

#Out

     A	    B	  C
0	1	test1	2.0
1	1	test2	2.0
2	1	test3	2.0

✅ A : 1이라는 정수를 가진 열 생성
✅ B : "test1", "test2", "test3" 문자열을 가지는 열 생성
✅ C : 2라는 실수를 가진 열 생성 ( 인덱스는 0, 1, 2 데이터 형식은 float32로 지정된 시리즈로 생성 )

참고

profile
🤍도전하는 건 즐거워요🤍

0개의 댓글