선형회귀 예제 적용 - 교통량과 CO2 관련 분석 모델 만들기 8일차

지니의 길옥·2023년 8월 9일
0

환경통계연구실

목록 보기
8/19
post-thumbnail

https://joyfuls.tistory.com/58

위의 블로그에서 아이리스 예제를 참고했다!

저번에 두개의 데이터를 하나의 데이터 프레임으로 만들어줬는데 오늘은 그것을 이용하여 무언가라도(?)해보았다.
솔직히 내가 지금 뭘 하고 있는지 모르겠다. 뭐라도 해야될 것 같아서 뚜들겨 보는데 솔직히 아닌 것 같다.

실패는 성공의 어머니이기도 하니까...일단 기록!

소심하게 시작👉👈


from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split

임포트 해주고~

정보를 출력해봤다.(컬럼 번호 알기 위해)

컬럼들을 따로 변수 지정 해주고

x,y에 들어갈 컬럼들을 나누어 주었다.

x_cols = cols[5:29]

y_cols = cols[29:53]


함수에 필요한게 시간뿐인 것 같아서


그리고 훈련,테스트 세트로 나눠준다!

time_train, time_test = train_test_split(time,test_size = 0.3)


잘 나눠졌따.

이게 왜 되지...하는 순간

에러 투척🚫!

해석해보니 NaN값이 있으면 LinearRegression()이 안돌아간다~라고 하더라.

...NaN값 다 지우면 데이터 다 날아가는뎁...

그래서 생각을 한게..NaN값에 0 넣기....

진짜 아닌것 같은데 그런거 있지않나 아닌 줄 알면서 하는거...

시험장에서 하 이건 진짜 답이 아닌데..하면서 적는거...

그래서 했다...

하니까 모델이 만들어지긴 한다..

model = LinearRegression()
model.fit(X=time_train[x_cols],y=time_train[y_cols])



모델 평가를 해보자

예측은

y_pred = model.predict(X=time_test[x_cols]) 
len(y_pred)

정답은

Y = time_test[y_cols] 
len(Y)

...왜 같냐고....

순간 내가 한 방법이 맞는 줄 알았다.

그럴리가🤷‍♀️

하............

빨리...여쭤보고싶다.

오늘의 결론

: 삽질했다🔨

profile
비전공자 주인장 일하느라 방치

0개의 댓글