[R]시계열데이터 특정 비율로 데이터셋 분할하는 방법

Oni·2023년 8월 28일
0

R

목록 보기
1/1

기본적으로 r은 python과 다르게 df.iloc[1:,] 같은 슬라이스 기능이 없다.

시계열데이터의 경우 train, test set을 random으로 선택하지 않고 날짜별로 정렬된 상태에서 일부만 test set으로 활용된다.
이때 간접적인 방법이 존재한다.

data_train<-lapply(data,
       function(ldata){
        train<-head(ldata,floor(nrow(ldata)*0.7))
        return(train)
})

data_test<-lapply(data,
       function(ldata){
         test<-tail(ldata,nrow(ldata)-floor(nrow(ldata)*0.7))
         return(test)
           })
profile
데이터 분석/엔지니어링/ML에 관한 기록

0개의 댓글