위의 블로그에서 아이리스 예제를 참고했다!
저번에 두개의 데이터를 하나의 데이터 프레임으로 만들어줬는데 오늘은 그것을 이용하여 무언가라도(?)해보았다.
솔직히 내가 지금 뭘 하고 있는지 모르겠다. 뭐라도 해야될 것 같아서 뚜들겨 보는데 솔직히 아닌 것 같다.
실패는 성공의 어머니이기도 하니까...일단 기록!
소심하게 시작👉👈
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
임포트 해주고~
정보를 출력해봤다.(컬럼 번호 알기 위해)
컬럼들을 따로 변수 지정 해주고
x,y에 들어갈 컬럼들을 나누어 주었다.
x_cols = cols[5:29]
y_cols = cols[29:53]
함수에 필요한게 시간뿐인 것 같아서
그리고 훈련,테스트 세트로 나눠준다!
time_train, time_test = train_test_split(time,test_size = 0.3)
잘 나눠졌따.
이게 왜 되지...하는 순간
에러 투척🚫!
해석해보니 NaN값이 있으면 LinearRegression()
이 안돌아간다~라고 하더라.
...NaN값 다 지우면 데이터 다 날아가는뎁...
그래서 생각을 한게..NaN값에 0 넣기....
진짜 아닌것 같은데 그런거 있지않나 아닌 줄 알면서 하는거...
시험장에서 하 이건 진짜 답이 아닌데..하면서 적는거...
그래서 했다...
하니까 모델이 만들어지긴 한다..
model = LinearRegression()
model.fit(X=time_train[x_cols],y=time_train[y_cols])
모델 평가를 해보자
예측은
y_pred = model.predict(X=time_test[x_cols])
len(y_pred)
정답은
Y = time_test[y_cols]
len(Y)
...왜 같냐고....
순간 내가 한 방법이 맞는 줄 알았다.
그럴리가🤷♀️
하............
빨리...여쭤보고싶다.
: 삽질했다🔨