[결론] 결론 도출

JJangnaa·2023년 5월 10일
0

 분석 목적을 설정하고, 그에 맞는 분석 방법을 선택하여 모델을 생성한 후 모델을 다듬는 과정을 통해 많은 양의 데이터가 필요하다는 것을 느꼈습니다.

 또한, 데이터 분석시 종속변수와 유의미하다고 보이지 않던 변수들이 예측 및 평가시 영향을 미치는 경우도 있었고 그 반대의 경우도 있었습니다. 이는 독립변수들 간의 영향을 미치는 경우 등 다양한 요인으로 인한 것으로 분석가의 재량이 필요한 부분이 많았습니다.

 따라서 모델을 만들 때에는 각 변수들 간의 관계 및 해당 데이터에 대한 이해도가 필요하며 분석 목적을 잊어서는 안됩니다.


~~ TMI !!! ~~
 지치는 과제였습니다.. 팀원들과 이 과제를 진행할 때, 저는 시계열 분석을 맡아서 했고 나머지 다중회귀분석이나 로지스틱 회귀분석은 건들지 않았던지라.. 복기하는데 고생 좀 했습니다. 물론 시계열 분석에서도 그 때 당시에는 데이터 전처리하는 데 지쳐서 분석을 제대로 못했지만, 이번에는 분석 부분을 좀 보안 했습니다.
 다중회귀 분석과 로지스틱 회귀분석은 정말..^^ 처음부터 다시 배우는 느낌으로 복기했습니다.. 고생스러웠지만 그만큼 얻은게 많아 뿌듯합니다!
 다음 시리즈로는 '머신러닝 기반 데이터 분석'을 진행할 예정입니다. 집에 컴퓨터가 없는 관계로 해당 시리즈는 이번주 금요일 또는 다음주 월요일에 업로드할 생각이니 참고바랍니다
profile
귀여운게 좋아

0개의 댓글