6주차 시간표
이번 주는 공휴일이 끼어있어서 월요일은 쉬었고 다음주도 월요일은 쉬다보니 아무래도 들뜬 기분에 집중이 좀 덜되는듯한 기분이 들기도 하는 한 주 였다.
장고 인스타그램 클론코딩 프로젝트
프로젝트 매니지먼트 세션 특강
- 최양임 매니저님
실전 머신러닝 적용 원격강의
머신러닝이란?
머신러닝에서 문제를 풀 때, 해답을 내는 방법을 크게 회귀 또는 분류로 나눌 수 있다.
머신러닝은 크게 세 가지로 나눌 수 있다. 지도/비지도/강화 학습이다.
선형회귀 : 데이터를 놓고 그걸 가장 잘 설명할 수 있는 선을 찾는 분석하는 방법을 선형 회귀(Linear Regression) 분석이라 부른다.
경사 하강법 : 일단 파라미터를 임의로 정한 다음에 조금씩 변화시켜가며 손실을 점점 줄여가는 방법으로 최적의 파라미터를 찾아가는 방법
데이터셋 분할
머신러닝 모델을 학습시키는 용도로 사용하고 전체 데이터셋의 약 80% 정도를 차지한다.
머신러닝 모델의 성능을 검증하고 튜닝하는 지표의 용도로 사용한다. 이 데이터는 정답 라벨이 있고, 학습 단계에서 사용하기는 하지만, 모델에게 데이터를 직접 보여주지는 않으므로 모델의 성능에 영향을 미치지는 않는다. 손실 함수, Optimizer 등을 바꾸면서 모델을 검증하는 용도로 사용하며 전체 데이터셋의 약 20% 정도를 차지한다.
정답 라벨이 없는 실제 환경에서의 평가 데이터셋이다. 검증 데이터셋으로 평가된 모델이 아무리 정확도가 높더라도 사용자가 사용하는 제품에서 제대로 동작하지 않는다면 소용이 없기 때문에 중요하다.
이번 주를 마치며
이번 주차는 장고 인스타그램 클론코딩 프로젝트를 마무리 짓고 발표 후 프로젝트 회고, 그리고 새로운 원격 강의에 들어가는 주차였다.
프로젝트의 경우 아직은 부족한 점을 너무 많이 느끼게 된 것 같다. 하지만 그만큼 뭔가를 해냈을 때의 성취감도 많이 느낄 수 있어서 복합적으로 좋은 경험을 가졌던 것 같다. 정말 바쁘고 힘들었지만 재미있었기 때문에 다음 프로젝트도 기대가 되기 시작했다.