AI Study[DataFrame]

이도환·2023년 9월 23일
1

AI

목록 보기
1/4
post-thumbnail

코드링크

DataFrame이란?

pd.DataFrame은 Python 프로그래밍 언어의 데이터 분석 라이브러리인 pandas에서 제공하는 중요한 데이터 구조 중 하나다. pd.DataFrame은 표 형태의 데이터를 저장하고 조작하는데 사용되며, 행과 열로 이루어진 2차원 데이터 구조를 나타낸다.

pd.DataFrame은 다양한 데이터 유형(숫자, 문자열, 날짜 등)을 포함하는 데이터를 저장할 수 있으며, 각 열은 서로 다른 유형의 데이터를 가질 수 있다. 이러한 유연성은 데이터 분석 및 조작 작업을 수행하는데 매우 유용하다.

from pandas import DataFrame
from pandas import Series

data = {
    '시가':[980,200,300],
    '고가':[990,300,500],
    '저가':[920,180,300],
    '종가':[930,180,400]
}
index = ['비트 코인', '리플', '이더리움']
df = DataFrame(data = data,index = index)
df

data = [
    [980,990,920,930],
    [200,300,180,180],
    [300,500,300,400]
]
colum = ['시가','고가','종가','저가']
index = ['비트 코인', '리플', '이더리움']
df = DataFrame(data = data,index = index, columns = colum)
df

pyupbit 란?

pyupbit은 파이썬을 사용하여 암호화폐 거래소인 Upbit과 상호작용하기 위한 라이브러리이다. Upbit은 대한민국의 주요한 암호화폐 거래소 중 하나이며, pyupbit 라이브러리를 사용하면 Upbit 거래소에서 거래 데이터를 검색하고 주문을 실행하는 등의 작업을 파이썬 프로그램을 통해 수행할 수 있다.

이를 활용한 데이터 다루기를 해보자

import pyupbit
df = pyupbit.get_ohlcv("KRW-BTC")
df

df["range"] = df['high'] - df['low']
df.head()

df2 = df.drop("volume",axis = 1) # axis = 1 은 column 
df2
date = "2023-10-4"
dt = pd.to_datetime(date)
type(date)
type(dt)

str
pandas._libs.tslibs.timestamps.Timestamp

df.loc[dt] = [100,100,100,100,100,100]
df

df["shift"] = df['close'].shift(1)

df["close"] - df["shift"]

2023-03-05 09:00:00 NaN
2023-03-06 09:00:00 -213000.0
2023-03-07 09:00:00 -190000.0
2023-03-08 09:00:00 -556000.0
2023-03-09 09:00:00 -1419000.0
...
2023-09-16 09:00:00 10000.0
2023-09-17 09:00:00 -180000.0
2023-09-18 09:00:00 242000.0
2023-09-19 09:00:00 500000.0
2023-09-20 09:00:00 -59000.0
Length: 200, dtype: float64

profile
개발 블로그

1개의 댓글

comment-user-thumbnail
2023년 9월 24일

앞으로도 지금의 열정 부탁드립니다. . . .

답글 달기
Powered by GraphCDN, the GraphQL CDN